中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

CUDA開發(fā)常見問題之基礎知識盤點

2019-02-26    來源:多智時代

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

在2010 GPU技術大會(GTC)上,英偉達(NVIDIA)公司展示了自2009 GTC閉幕后的一年內(nèi)CUDA的發(fā)展進程(如下圖),從中不難看出CUDA的強勁勢頭。當然,在隨后的2011年這一勢頭更加明顯。而對于大量剛剛接觸CUDA的初學者來說,常常會被很多CUDA和GPU計算的相關問題所困擾。下面的內(nèi)容是對CUDA和GPU計算常見問題的解答,希望能對大家的學習過程有所幫助。

CUDA開發(fā)常見問題之基礎知識盤點

Q1:什么是CUDA?

A1:CUDA是NVIDIA公司推出的一種通用并行計算架構。CUDA利用NVIDIA圖形處理器(GPU)的并行計算引擎解決大量復雜計算問題,比單純使用CPU效率提高數(shù)倍。

目前有超過2.5億支持CUDA的GPU已經(jīng)售出,大量的軟件開發(fā)人員已經(jīng)開始使用免費的CUDA軟件開發(fā)工具,來解決各種專業(yè)和家庭應用中的難題。這些難題涉及視頻和音頻處理、物理模擬、石油和天然氣勘探、產(chǎn)品設計,醫(yī)療成像和科學研究等各個領域。

CUDA允許開發(fā)人員使用C/C++等高級編程語言編寫應用程序,并且支持微軟DirectX和OpenCL等多種API,無縫的將現(xiàn)在和未來的開發(fā)環(huán)境融合到一起。

Q2:什么是NVIDIA Tesla?

A2:NVIDIA Tesla計算解決方案搭載世界上第一個萬億次浮點運算的多核處理器,能夠?qū)崿F(xiàn)節(jié)能高效的并行計算能力。內(nèi)置448個CUDA核心的處理器(C2070)和標準C編譯器,簡化了應用程序的開發(fā),Tesla集群能夠快速準確的解決世界上最重要的計算難題。

Q3:OpenCL與CUDA有什么關系?

A3:CUDA是NVIDIA的并行計算架構的名稱。CUDA技術包括硬件和軟件,它實現(xiàn)了在NVIDIA GPU上的計算。CUDA也將編程語言擴展到C/C++。C/C++提供了運行時(runtime)和API級別的驅(qū)動程序來訪問GPU硬件。CUDA也是一個龐大而活躍的生態(tài)系統(tǒng),包括大量支持庫和開發(fā)工具,CUDA C/C++已成為大多數(shù)開發(fā)人員的首選解決方案。由PGI公司研發(fā)的CUDA-x86已經(jīng)發(fā)布,這意味著CUDA C/C++代碼可以運行在基于CPU的服務器上。NVIDIA是Khronos Group的主席和積極成員之一,Khronos Group是制定新興標準OpenCL的組織。CUDA extensions與OpenCL API在設計上有很多相似之處。OpenCL API?類似于“driver API”,CUDA語言集成解決方案允許用戶只使用被稱為“CUDA Runtime API”的較高層次的抽象。CUDA C/C++是NVIDIA的創(chuàng)新平臺,它迅速推出新的特性和功能以滿足客戶的需求。

Q4:GPU計算比單獨使用CPU能夠得到怎樣的性能提升呢?

A4:這取決于映射到架構上的問題。對于數(shù)據(jù)并行應用、加速兩個以上mangitude命令等問題已經(jīng)得到驗證可以有效提高計算性能?梢酝ㄟ^瀏覽CUDA技術研究、開發(fā)、應用和合作伙伴的頁面,了解更多內(nèi)容。

Q5:CUDA支持哪些操作系統(tǒng)?

A5:CUDA支持Windows 7、Windows XP、Windows Vista、Linux和Mac OS(包括32位和64位版本)。有關CUDA支持系統(tǒng)的完整列表,請參閱最新CUDA Toolkit下載發(fā)行說明。

Q6:CUDA可以在哪些GPU上運行?

A6:GPU計算是NVIDIA所有最新獨立顯卡的標準功能。在Supported GPUs頁面上可以找到支持CUDA的GPU的完整列表。

Q7:什么是“計算能力(compute capability)”?

A7:計算能力(compute capability)是指GPU中的計算硬件版本。

計算能力1.0對應于最初的G80架構。

計算能力1.1(隨后的部分G8x中引入),增加了對全局內(nèi)存原子操作(atomic operations)的支持。

計算能力1.2(GT200架構中引入)增加了以下新功能:

●支持共享內(nèi)存中的原子函數(shù)(atomic functions)操作,以及全局內(nèi)存中的64位原子函數(shù)操作;

●支持warp vote函數(shù);

●每個多處理器(multiprocessor)有16384個寄存器;

●每個多處理器最多有32個活動warp;

●每個多處理器最多有1024個活動線程。

計算能力1.3增加了對雙精度浮點數(shù)的支持。

計算能力2.0(Fermi架構中引入)增加了許多新功能,包括:

●支持并發(fā)核心執(zhí)行;

●64位尋址;

●統(tǒng)一的虛擬尋址(UVA);

●GPU Direct,點對點通信。

如果需要了解GPU及其計算能力的完整列表,請參閱最新CUDA編程指南(CUDA Programming Guide)。

Q8:并行程序設計的學習資料在哪可以找到?

A8:目前有大學的在線課程、技術網(wǎng)絡研討會和系列文章,以及有關并行計算的優(yōu)秀書籍,這些都可以在CUDA教育頁面上找到。經(jīng)常IT168 CUDA頻道,也會給CUDA學習帶來很多幫助。

在不久的將來,云計算一定會徹底走入我們的生活,有興趣入行未來前沿產(chǎn)業(yè)的朋友,可以收藏云計算,及時獲取人工智能、大數(shù)據(jù)、云計算和物聯(lián)網(wǎng)的前沿資訊和基礎知識,讓我們一起攜手,引領人工智能的未來!

標簽: linux 大數(shù)據(jù) 代碼 服務器 通信 網(wǎng)絡 云計算

版權申明:本站文章部分自網(wǎng)絡,如有侵權,請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:在線應用催生Scale-out存儲提升容量

下一篇:如何實現(xiàn)Hyper-V環(huán)境中的存儲管理