中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

浪潮發(fā)布業(yè)界最高GPU密度的SR-AI整機(jī)柜

2018-06-11    來(lái)源:

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用

      在不久前結(jié)束的2017浪潮云數(shù)據(jù)中心全國(guó)合作伙伴大會(huì)(IPF)上,浪潮秉承堅(jiān)持圍繞"計(jì)算+"戰(zhàn)略,進(jìn)一步明確業(yè)務(wù)重心,聚焦智慧計(jì)算,發(fā)展開(kāi)放融合的計(jì)算生態(tài),建立智慧計(jì)算市場(chǎng)的領(lǐng)導(dǎo)力。

      智慧計(jì)算的未來(lái)在商業(yè)應(yīng)用, 隨著人工智能應(yīng)用的快速發(fā)展,AI所需的計(jì)算力也急劇攀升。此前,浪潮就已在AI計(jì)算平臺(tái)、架構(gòu)領(lǐng)域布局,擁有業(yè)界完整的支持2、4、8 GPU卡的異構(gòu)超算服務(wù)器陣列。而本次IPF上,浪潮發(fā)布了業(yè)界最高密度的、單機(jī)點(diǎn)支持16塊GPU卡的SR-AI整機(jī)柜,進(jìn)一步優(yōu)化了AI計(jì)算硬件架構(gòu),改變?cè)蠧PU-GPU緊耦合狀態(tài),實(shí)現(xiàn)GPU資源的靈活池化擴(kuò)容。

 

更復(fù)雜的AI應(yīng)用呼喚更強(qiáng)大的計(jì)算平臺(tái)

      深度學(xué)習(xí)概念和淺層學(xué)習(xí)算法已經(jīng)被提出多年,而人工智能近年才開(kāi)始逐漸升溫,原因是人工智能技術(shù)的進(jìn)步受限于計(jì)算平臺(tái)的性能和數(shù)據(jù)量的積累。舉個(gè)例子,從IBM深藍(lán)戰(zhàn)勝卡斯帕羅夫,浪潮天梭戰(zhàn)勝五位象棋大師,再到谷歌AlphaGo戰(zhàn)勝?lài)骞谲娎钍朗,解決問(wèn)題的博弈樹(shù)空間擴(kuò)大了237數(shù)量級(jí),這其中需要更優(yōu)化的算法,也需要更強(qiáng)大的計(jì)算平臺(tái)來(lái)支撐實(shí)時(shí)運(yùn)算。

      除了AI游戲,在現(xiàn)實(shí)生活中人工智能的應(yīng)用也越來(lái)越廣泛和復(fù)雜,從人臉簽到打卡,到行動(dòng)軌跡追蹤,再到無(wú)人駕駛汽車(chē),更復(fù)雜的AI應(yīng)用呼喚更強(qiáng)大的計(jì)算平臺(tái)。傳統(tǒng)的單機(jī)單卡、2卡甚至8卡已經(jīng)不能滿足多樣化的業(yè)務(wù)需求,浪潮SR-AI整機(jī)柜服務(wù)器以單節(jié)點(diǎn)16卡的更高密度,滿足當(dāng)下快速膨脹的AI計(jì)算能力需求。

 

更高密度+資源解耦,10倍于傳統(tǒng)AI計(jì)算設(shè)備性能

      此次,浪潮與百度聯(lián)合發(fā)布的SR-AI整機(jī)柜服務(wù)器,符合最新的天蝎2.5標(biāo)準(zhǔn),是全球首個(gè)采用PCIe Fabric互聯(lián)架構(gòu)設(shè)計(jì)的AI方案,通過(guò)PCI-E交換機(jī)和GPU BOX兩個(gè)模塊的配合,打破GPU和CPU的物理耦合,讓兩者可以靈活擴(kuò)展,相對(duì)于傳統(tǒng)的GPU服務(wù)器,這是種顛覆式的創(chuàng)新,帶來(lái)了高密度、低延遲、易擴(kuò)展等優(yōu)勢(shì)。

      首先,傳統(tǒng)的AI計(jì)算設(shè)備集群需要通過(guò)高速網(wǎng)絡(luò)實(shí)現(xiàn)數(shù)據(jù)的交互,著會(huì)帶來(lái)us級(jí)以上的延遲,而SR-AI整機(jī)柜中GPU BOX間的互聯(lián)是通過(guò)PCI-E交換機(jī)來(lái)實(shí)現(xiàn),并借助GPUDirect RDMA技術(shù)可以大幅下降跨節(jié)點(diǎn)GPU間的通信延遲,能夠?qū)崿F(xiàn)ns級(jí)網(wǎng)絡(luò)延時(shí)。

      第二,SR-AI整機(jī)柜的I/O BOX單節(jié)點(diǎn)即可實(shí)現(xiàn)支持16個(gè)GPU的超大擴(kuò)展,并且可以通過(guò)PCI-E交換機(jī)實(shí)現(xiàn)4個(gè)BOX、64塊GPU的級(jí)聯(lián),峰值處理能力達(dá)到為512TFlops。

      第三,SR-AI整機(jī)柜的GPU資源擴(kuò)展無(wú)需同步配置高成本的IT資源(比如IB交換機(jī)),成本可優(yōu)化5%以上,并隨著規(guī)模上升成本優(yōu)勢(shì)越明顯。

      SR-AI整機(jī)柜是面向更大規(guī)模數(shù)據(jù)集和深層神經(jīng)網(wǎng)絡(luò)的超大規(guī)模AI計(jì)算平臺(tái),能夠高效支撐復(fù)雜的深度學(xué)習(xí)線下模型訓(xùn)練任務(wù),適用于圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理、搜索排序等AI應(yīng)用。百度實(shí)際業(yè)務(wù)的測(cè)試數(shù)據(jù)顯示,SR-AI整機(jī)柜相比傳統(tǒng)的AI方案性能提高5-10倍!

 

高效開(kāi)發(fā)框架+算法協(xié)同優(yōu)化,AI計(jì)算效率最大化

      與 CPU 少量的邏輯運(yùn)算單元相比,GPUFPGAMIC這種協(xié)處理加速設(shè)備整個(gè)就是一個(gè)龐大的計(jì)算矩陣,可實(shí)現(xiàn) 10-100 倍應(yīng)用吞吐量。但同時(shí),這種龐大的并行能力需要付出代價(jià):需要較強(qiáng)的軟件開(kāi)發(fā)能力和算法優(yōu)化能力。

      為此,浪潮將高效深度學(xué)習(xí)框架Caffe-MPI開(kāi)源,與眾多開(kāi)發(fā)者共同優(yōu)化,為深度學(xué)習(xí)的用戶提供了更便捷、更高效的應(yīng)用手段。浪潮Caffe-MPI能夠在保證正確率相同的情況下,在4節(jié)點(diǎn)下16卡的性能較單卡提升13倍,并增加了對(duì)cuDNN庫(kù)的支持,使程序開(kāi)發(fā)人員能夠輕松實(shí)現(xiàn)高性能深度學(xué)習(xí)代碼的開(kāi)發(fā)。

      在算法方面,此前浪潮與客戶在GPU加速加速流量特征分析技術(shù)開(kāi)展合作,通過(guò)軟硬件和算法的協(xié)同優(yōu)化,使訓(xùn)練24萬(wàn)樣本的時(shí)間單節(jié)點(diǎn)4GPU相對(duì)于單GPU加速3倍,單機(jī)4GPU卡程序性能較原始版本加速270倍。

      數(shù)據(jù)顯示,2016年浪潮在人工智能計(jì)算領(lǐng)域的市場(chǎng)份額超過(guò)60%,為百度、阿里巴巴、騰訊、奇虎、科大訊飛、Face++等中國(guó)人工智能企業(yè),提供基于GPU、FPGA、KNL等協(xié)處理加速服務(wù)器和caffe-MPI等軟件、算法優(yōu)化。

標(biāo)簽: 標(biāo)準(zhǔn) 代碼 服務(wù)器 谷歌 開(kāi)發(fā)者 企業(yè) 搜索 通信 網(wǎng)絡(luò) 問(wèn)題 用戶

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:2017WHD.china與您一起暢享融云即時(shí)通訊云服務(wù)

下一篇:大勢(shì)所趨,企業(yè)全面轉(zhuǎn)向超融合基礎(chǔ)架構(gòu)