浪潮發(fā)布業(yè)界最高GPU密度的SR-AI整機(jī)柜

2018-06-11 來(lái)源：

容器云強(qiáng)勢(shì)上線！快速搭建集群，上萬(wàn)Linux鏡像隨意使用

在不久前結(jié)束的2017浪潮云數(shù)據(jù)中心全國(guó)合作伙伴大會(huì)（IPF）上，浪潮秉承堅(jiān)持圍繞"計(jì)算+"戰(zhàn)略，進(jìn)一步明確業(yè)務(wù)重心，聚焦智慧計(jì)算，發(fā)展開(kāi)放融合的計(jì)算生態(tài)，建立智慧計(jì)算市場(chǎng)的領(lǐng)導(dǎo)力。

智慧計(jì)算的未來(lái)在商業(yè)應(yīng)用，隨著人工智能應(yīng)用的快速發(fā)展，AI所需的計(jì)算力也急劇攀升。此前，浪潮就已在AI計(jì)算平臺(tái)、架構(gòu)領(lǐng)域布局，擁有業(yè)界完整的支持2、4、8 GPU卡的異構(gòu)超算服務(wù)器陣列。而本次IPF上，浪潮發(fā)布了業(yè)界最高密度的、單機(jī)點(diǎn)支持16塊GPU卡的SR-AI整機(jī)柜，進(jìn)一步優(yōu)化了AI計(jì)算硬件架構(gòu)，改變?cè)蠧PU-GPU緊耦合狀態(tài)，實(shí)現(xiàn)GPU資源的靈活池化擴(kuò)容。

更復(fù)雜的AI應(yīng)用呼喚更強(qiáng)大的計(jì)算平臺(tái)

深度學(xué)習(xí)概念和淺層學(xué)習(xí)算法已經(jīng)被提出多年，而人工智能近年才開(kāi)始逐漸升溫，原因是人工智能技術(shù)的進(jìn)步受限于計(jì)算平臺(tái)的性能和數(shù)據(jù)量的積累。舉個(gè)例子，從IBM深藍(lán)戰(zhàn)勝卡斯帕羅夫，浪潮天梭戰(zhàn)勝五位象棋大師，再到谷歌AlphaGo戰(zhàn)勝?lài)骞谲娎钍朗�，解決問(wèn)題的博弈樹(shù)空間擴(kuò)大了237數(shù)量級(jí)，這其中需要更優(yōu)化的算法，也需要更強(qiáng)大的計(jì)算平臺(tái)來(lái)支撐實(shí)時(shí)運(yùn)算。

除了AI游戲，在現(xiàn)實(shí)生活中人工智能的應(yīng)用也越來(lái)越廣泛和復(fù)雜，從人臉簽到打卡，到行動(dòng)軌跡追蹤，再到無(wú)人駕駛汽車(chē)，更復(fù)雜的AI應(yīng)用呼喚更強(qiáng)大的計(jì)算平臺(tái)。傳統(tǒng)的單機(jī)單卡、2卡甚至8卡已經(jīng)不能滿足多樣化的業(yè)務(wù)需求，浪潮SR-AI整機(jī)柜服務(wù)器以單節(jié)點(diǎn)16卡的更高密度，滿足當(dāng)下快速膨脹的AI計(jì)算能力需求。

更高密度+資源解耦，10倍于傳統(tǒng)AI計(jì)算設(shè)備性能

此次，浪潮與百度聯(lián)合發(fā)布的SR-AI整機(jī)柜服務(wù)器，符合最新的天蝎2.5標(biāo)準(zhǔn)，是全球首個(gè)采用PCIe Fabric互聯(lián)架構(gòu)設(shè)計(jì)的AI方案，通過(guò)PCI-E交換機(jī)和GPU BOX兩個(gè)模塊的配合，打破GPU和CPU的物理耦合，讓兩者可以靈活擴(kuò)展，相對(duì)于傳統(tǒng)的GPU服務(wù)器，這是種顛覆式的創(chuàng)新，帶來(lái)了高密度、低延遲、易擴(kuò)展等優(yōu)勢(shì)。

首先，傳統(tǒng)的AI計(jì)算設(shè)備集群需要通過(guò)高速網(wǎng)絡(luò)實(shí)現(xiàn)數(shù)據(jù)的交互，著會(huì)帶來(lái)us級(jí)以上的延遲，而SR-AI整機(jī)柜中GPU BOX間的互聯(lián)是通過(guò)PCI-E交換機(jī)來(lái)實(shí)現(xiàn)，并借助GPUDirect RDMA技術(shù)可以大幅下降跨節(jié)點(diǎn)GPU間的通信延遲，能夠?qū)崿F(xiàn)ns級(jí)網(wǎng)絡(luò)延時(shí)。

第二，SR-AI整機(jī)柜的I/O BOX單節(jié)點(diǎn)即可實(shí)現(xiàn)支持16個(gè)GPU的超大擴(kuò)展，并且可以通過(guò)PCI-E交換機(jī)實(shí)現(xiàn)4個(gè)BOX、64塊GPU的級(jí)聯(lián)，峰值處理能力達(dá)到為512TFlops。

第三，SR-AI整機(jī)柜的GPU資源擴(kuò)展無(wú)需同步配置高成本的IT資源（比如IB交換機(jī)），成本可優(yōu)化5%以上，并隨著規(guī)模上升成本優(yōu)勢(shì)越明顯。

SR-AI整機(jī)柜是面向更大規(guī)模數(shù)據(jù)集和深層神經(jīng)網(wǎng)絡(luò)的超大規(guī)模AI計(jì)算平臺(tái)，能夠高效支撐復(fù)雜的深度學(xué)習(xí)線下模型訓(xùn)練任務(wù)，適用于圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理、搜索排序等AI應(yīng)用。百度實(shí)際業(yè)務(wù)的測(cè)試數(shù)據(jù)顯示，SR-AI整機(jī)柜相比傳統(tǒng)的AI方案性能提高5-10倍！

高效開(kāi)發(fā)框架+算法協(xié)同優(yōu)化，AI計(jì)算效率最大化

與 CPU 少量的邏輯運(yùn)算單元相比，GPUFPGAMIC這種協(xié)處理加速設(shè)備整個(gè)就是一個(gè)龐大的計(jì)算矩陣，可實(shí)現(xiàn) 10-100 倍應(yīng)用吞吐量。但同時(shí)，這種龐大的并行能力需要付出代價(jià)：需要較強(qiáng)的軟件開(kāi)發(fā)能力和算法優(yōu)化能力。

為此，浪潮將高效深度學(xué)習(xí)框架Caffe-MPI開(kāi)源，與眾多開(kāi)發(fā)者共同優(yōu)化，為深度學(xué)習(xí)的用戶提供了更便捷、更高效的應(yīng)用手段。浪潮Caffe-MPI能夠在保證正確率相同的情況下，在4節(jié)點(diǎn)下16卡的性能較單卡提升13倍，并增加了對(duì)cuDNN庫(kù)的支持，使程序開(kāi)發(fā)人員能夠輕松實(shí)現(xiàn)高性能深度學(xué)習(xí)代碼的開(kāi)發(fā)。

在算法方面，此前浪潮與客戶在GPU加速加速流量特征分析技術(shù)開(kāi)展合作，通過(guò)軟硬件和算法的協(xié)同優(yōu)化，使訓(xùn)練24萬(wàn)樣本的時(shí)間單節(jié)點(diǎn)4GPU相對(duì)于單GPU加速3倍，單機(jī)4GPU卡程序性能較原始版本加速270倍。

數(shù)據(jù)顯示，2016年浪潮在人工智能計(jì)算領(lǐng)域的市場(chǎng)份額超過(guò)60%，為百度、阿里巴巴、騰訊、奇虎、科大訊飛、Face++等中國(guó)人工智能企業(yè)，提供基于GPU、FPGA、KNL等協(xié)處理加速服務(wù)器和caffe-MPI等軟件、算法優(yōu)化。

標(biāo)簽：標(biāo)準(zhǔn) 代碼服務(wù)器谷歌開(kāi)發(fā)者企業(yè) 搜索通信網(wǎng)絡(luò) 問(wèn)題用戶

版權(quán)申明：本站文章部分自網(wǎng)絡(luò)，如有侵權(quán)，請(qǐng)聯(lián)系：west999com@outlook.com
特別注意：本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)！
本站所提供的圖片等素材，版權(quán)歸原作者所有，如需使用，請(qǐng)與原作者聯(lián)系。

上一篇:2017WHD.china與您一起暢享融云即時(shí)通訊云服務(wù)

下一篇:大勢(shì)所趨，企業(yè)全面轉(zhuǎn)向超融合基礎(chǔ)架構(gòu)

相關(guān)文章

最新資訊

熱門(mén)推薦

為學(xué)習(xí)和知識(shí)分享目的，本站文章部分自網(wǎng)絡(luò)，本站文章部分自網(wǎng)絡(luò)，如有侵權(quán)，請(qǐng)聯(lián)系：2653426586@qq.com QQ：2653426586

如有其他需求，請(qǐng)聯(lián)系：2653426586@qq.com QQ：2653426586

友情鏈接：網(wǎng)絡(luò)安全運(yùn)維經(jīng)驗(yàn) IT技術(shù)分享運(yùn)維隨筆錄鮮花東郊到家往約到家

中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

浪潮發(fā)布業(yè)界最高GPU密度的SR-AI整機(jī)柜