中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

碼農(nóng)福音:一個專門開發(fā)高性能大數(shù)據(jù)代碼的系統(tǒng)「開源了」

2018-06-14    來源:

容器云強(qiáng)勢上線!快速搭建集群,上萬Linux鏡像隨意使用
賴斯大學(xué)的科研團(tuán)隊(duì)將在本周的 SIGMOD 數(shù)據(jù)管理國際大會上推介 PlinyCompute。

每個精疲力竭的程序員都竭力在 Spark 之類的‘大數(shù)據(jù)’平臺上實(shí)現(xiàn)復(fù)雜的對象和工作流程,心里想‘有沒有一種更好的方法?’美國國防高級研究計(jì)劃局(DARPA)資助的賴斯大學(xué) Pliny 項(xiàng)目的計(jì)算機(jī)科學(xué)家們認(rèn)為,他們現(xiàn)已有了解決之道,有望為程序員們帶來福音。

 

 

PlinyCompute 的 logo

賴斯大學(xué)的 PlinyCompute 將于周四在 2018 年 ACM SIGMOD 大會上公布。該團(tuán)隊(duì)在同行評審的大會論文(https://dl.acm.org/citation.cfm?id=3196933)中介紹 PlinyCompute 是“一種專門用于開發(fā)高性能大數(shù)據(jù)代碼的系統(tǒng)”。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

賴斯大學(xué)領(lǐng)導(dǎo)開發(fā)該平臺的計(jì)算機(jī)科學(xué)教授克里斯·杰梅恩(Chris Jermaine)表示,與 Spark 一樣,PlinyCompute 力求易于使用、用途廣泛。與 Spark 不一樣,PlinyCompute 旨在支持以前只有超級計(jì)算機(jī)或高性能計(jì)算機(jī)(HPC)才能實(shí)現(xiàn)的強(qiáng)大計(jì)算。

杰梅恩說:“借助機(jī)器學(xué)習(xí),尤其是借助深度學(xué)習(xí),人們看到了復(fù)雜的分析算法應(yīng)用于大數(shù)據(jù)時可以做些什么。從《財富》500 強(qiáng)企業(yè)高管到神經(jīng)科學(xué)研究人員,每個人都在渴求越來越復(fù)雜的算法,而如今系統(tǒng)程序員滿足這個要求的辦法基本上差強(qiáng)人意。雖然 HPC 能提供這種性能,但要花好幾年才能學(xué)會為 HPC 編寫代碼;也許更糟糕的是,可能要花好幾天才能用 Spark 創(chuàng)建的工具或庫可能需要好幾個月才能在 HPC 上編程。”

他說:“Spark 是為大數(shù)據(jù)構(gòu)建的,它支持 HPC 無法支持的特性,比如簡易的負(fù)載均衡、容錯和資源分配,這對于數(shù)據(jù)密集型任務(wù)來說絕對必不可少。由于這個,又由于開發(fā)時間比 HPC 短得多,人們在構(gòu)建可以在 Spark 上運(yùn)行的新工具,用于處理機(jī)器學(xué)習(xí)和圖形分析等復(fù)雜任務(wù)。”

鄒佳(Jia Zou)是賴斯大學(xué)的研究科學(xué)家兼描述 PlinyCompute 的 ACM SIGMOD 論文的第一作者,她表示,由于 Spark 在設(shè)計(jì)當(dāng)初并未考慮到復(fù)雜計(jì)算,所以它的計(jì)算性能只能提升到目前這個地步。

鄒佳在 2015 年進(jìn)入賴斯大學(xué)之前已在 IBM 研究中國院研究了六年的大規(guī)模分析和數(shù)據(jù)管理系統(tǒng),她說:“Spark 建立在 Java 虛擬機(jī)即 JVM 的基礎(chǔ)上,JVM 負(fù)責(zé)管理運(yùn)行時環(huán)境,并將關(guān)于內(nèi)存管理的大部分細(xì)節(jié)抽取出來。Spark 依賴 JVM,因此其性能受到了影響,尤其是像訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)搞深度學(xué)習(xí)這些任務(wù)對計(jì)算的需求上升后,更是如此。”

 

 

賴斯大學(xué)的計(jì)算機(jī)科學(xué)家克里斯·杰梅恩領(lǐng)導(dǎo) PlinyCompute 項(xiàng)目

鄒說:“PlinyCompute 不一樣,因?yàn)樗耆菫楦咝阅芏O(shè)計(jì)的。我們在基準(zhǔn)測試中發(fā)現(xiàn),PlinyCompute 的速度至少是 Spark 的兩倍;在一些情況下,實(shí)現(xiàn)復(fù)雜對象處理和庫式計(jì)算的速度比 Spark 快 50 倍。”

她表示,測試已表明,PlinyCompute 在構(gòu)建高性能工具和庫方面比同類工具更勝一籌。

杰梅恩表示,不是所有的程序員都會覺得為 PlinyCompute 編寫代碼很容易。與 Spark 所需的基于 Java 的編碼不同,PlinyCompute 庫和模型必須用 C ++ 編寫。

杰梅恩說:“PlinyCompute 具有更大的靈活性。對于 C ++ 方面經(jīng)驗(yàn)和知識相對缺乏的人來說,這可能是一個挑戰(zhàn),但我們還對完成各種實(shí)現(xiàn)所需的代碼行數(shù)進(jìn)行了一番橫向比較。結(jié)果發(fā)現(xiàn),在大多數(shù)情況下,PlinyCompute 和 Spark 之間沒有顯著差異。”

 

 

賴斯大學(xué)的研究科學(xué)家鄒佳是介紹 PlinyCompute 的同行評審的新論文的第一作者

Pliny 項(xiàng)目于 2014 年啟動,這個 DARPA 資助的項(xiàng)目拿到了 1100 萬美元款項(xiàng),致力于開發(fā)先進(jìn)的編程工具,從而能夠?yàn)槌绦騿T們“自動完成代碼”和“自動糾正代碼”,就像軟件在 Web 瀏覽器和智能手機(jī)上完成搜索查詢、糾正拼寫那樣。Pliny 使用機(jī)器學(xué)習(xí)來讀取數(shù)十億行的開源計(jì)算機(jī)程序,并從中學(xué)習(xí);杰梅恩表示,PlinyCompute 脫胎于這個項(xiàng)目。

他說:“這是一種計(jì)算復(fù)雜的機(jī)器學(xué)習(xí)應(yīng)用,實(shí)際上沒有一個好的工具來構(gòu)建它。我們一開始就認(rèn)識到,PlinyCompute 這種工具可以用來解決遠(yuǎn)比我們用 Pliny 項(xiàng)目來解決的問題廣泛得多的問題。”

想了解安裝及部署信息、API、FAQ 和教程等更多信息,請?jiān)L問 plinycompute.rice.edu。

這項(xiàng)研究還得到了國家科學(xué)基金會(NSF)的支持。

PlinyCompute SIGMOD 論文的其他作者包括:Matthew Barnett、Tania Lorido-Botran、Shangyu Luo、Carlos Monroy、Sourav Sikdar、Kia Teymourian 和 Binhang Yuan,他們都來自賴斯大學(xué)。

 

 

賴斯大學(xué)的 PlinyCompute 團(tuán)隊(duì)包括(從左往右):Shangyu Luo、Sourav Sikdar、Jia Zou、 Tania Lorido、Binhang Yuan、Jessica Yu、Chris Jermaine、Carlos Monroy、Dimitrije Jankov 和 Matt Barnett。

標(biāo)簽: https 大數(shù)據(jù) 代碼 搜索 網(wǎng)絡(luò)

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:臺大李宏毅教授最新課程,深度強(qiáng)化學(xué)習(xí)有國語版啦!

下一篇:黑客:我們決定無條件刪除A站被泄漏數(shù)據(jù)庫