站長資訊平臺

CUDA開發(fā)常見問題之基礎知識盤點

2019-02-26 來源：多智時代

在2010 GPU技術大會(GTC)上，英偉達(NVIDIA)公司展示了自2009 GTC閉幕后的一年內(nèi)CUDA的發(fā)展進程(如下圖)，從中不難看出CUDA的強勁勢頭。當然，在隨后的2011年這一勢頭更加明顯。而對于大量剛剛接觸CUDA的初學者來說，常常會被很多CUDA和GPU計算的相關問題所困擾。下面的內(nèi)容是對CUDA和GPU計算常見問題的解答，希望能對大家的學習過程有所幫助。

Q1：什么是CUDA?

A1：CUDA是NVIDIA公司推出的一種通用并行計算架構。CUDA利用NVIDIA圖形處理器(GPU)的并行計算引擎解決大量復雜計算問題，比單純使用CPU效率提高數(shù)倍。

目前有超過2.5億支持CUDA的GPU已經(jīng)售出，大量的軟件開發(fā)人員已經(jīng)開始使用免費的CUDA軟件開發(fā)工具，來解決各種專業(yè)和家庭應用中的難題。這些難題涉及視頻和音頻處理、物理模擬、石油和天然氣勘探、產(chǎn)品設計，醫(yī)療成像和科學研究等各個領域。

CUDA允許開發(fā)人員使用C/C++等高級編程語言編寫應用程序，并且支持微軟DirectX和OpenCL等多種API，無縫的將現(xiàn)在和未來的開發(fā)環(huán)境融合到一起。

Q2：什么是NVIDIA Tesla?

A2：NVIDIA Tesla計算解決方案搭載世界上第一個萬億次浮點運算的多核處理器，能夠?qū)崿F(xiàn)節(jié)能高效的并行計算能力。內(nèi)置448個CUDA核心的處理器(C2070)和標準C編譯器，簡化了應用程序的開發(fā)，Tesla集群能夠快速準確的解決世界上最重要的計算難題。

Q3：OpenCL與CUDA有什么關系?

A3：CUDA是NVIDIA的并行計算架構的名稱。CUDA技術包括硬件和軟件，它實現(xiàn)了在NVIDIA GPU上的計算。CUDA也將編程語言擴展到C/C++。C/C++提供了運行時(runtime)和API級別的驅(qū)動程序來訪問GPU硬件。CUDA也是一個龐大而活躍的生態(tài)系統(tǒng)，包括大量支持庫和開發(fā)工具，CUDA C/C++已成為大多數(shù)開發(fā)人員的首選解決方案。由PGI公司研發(fā)的CUDA-x86已經(jīng)發(fā)布，這意味著CUDA C/C++代碼可以運行在基于CPU的服務器上。NVIDIA是Khronos Group的主席和積極成員之一，Khronos Group是制定新興標準OpenCL的組織。CUDA extensions與OpenCL API在設計上有很多相似之處。OpenCL API?類似于“driver API”，CUDA語言集成解決方案允許用戶只使用被稱為“CUDA Runtime API”的較高層次的抽象。CUDA C/C++是NVIDIA的創(chuàng)新平臺，它迅速推出新的特性和功能以滿足客戶的需求。

Q4：GPU計算比單獨使用CPU能夠得到怎樣的性能提升呢?

A4：這取決于映射到架構上的問題。對于數(shù)據(jù)并行應用、加速兩個以上mangitude命令等問題已經(jīng)得到驗證可以有效提高計算性能�？梢酝ㄟ^瀏覽CUDA技術研究、開發(fā)、應用和合作伙伴的頁面，了解更多內(nèi)容。

Q5：CUDA支持哪些操作系統(tǒng)?

A5：CUDA支持Windows 7、Windows XP、Windows Vista、Linux和Mac OS(包括32位和64位版本)。有關CUDA支持系統(tǒng)的完整列表，請參閱最新CUDA Toolkit下載發(fā)行說明。

Q6：CUDA可以在哪些GPU上運行?

A6：GPU計算是NVIDIA所有最新獨立顯卡的標準功能。在Supported GPUs頁面上可以找到支持CUDA的GPU的完整列表。

Q7：什么是“計算能力(compute capability)”?

A7：計算能力(compute capability)是指GPU中的計算硬件版本。

計算能力1.0對應于最初的G80架構。

計算能力1.1(隨后的部分G8x中引入)，增加了對全局內(nèi)存原子操作(atomic operations)的支持。

計算能力1.2(GT200架構中引入)增加了以下新功能：

●支持共享內(nèi)存中的原子函數(shù)(atomic functions)操作，以及全局內(nèi)存中的64位原子函數(shù)操作;

●支持warp vote函數(shù);

●每個多處理器(multiprocessor)有16384個寄存器;

●每個多處理器最多有32個活動warp;

●每個多處理器最多有1024個活動線程。

計算能力1.3增加了對雙精度浮點數(shù)的支持。

計算能力2.0(Fermi架構中引入)增加了許多新功能，包括：

●支持并發(fā)核心執(zhí)行;

●64位尋址;

●統(tǒng)一的虛擬尋址(UVA);

●GPU Direct，點對點通信。

如果需要了解GPU及其計算能力的完整列表，請參閱最新CUDA編程指南(CUDA Programming Guide)。

Q8：并行程序設計的學習資料在哪可以找到?

A8：目前有大學的在線課程、技術網(wǎng)絡研討會和系列文章，以及有關并行計算的優(yōu)秀書籍，這些都可以在CUDA教育頁面上找到。經(jīng)常IT168 CUDA頻道，也會給CUDA學習帶來很多幫助。

在不久的將來，云計算一定會徹底走入我們的生活，有興趣入行未來前沿產(chǎn)業(yè)的朋友，可以收藏云計算，及時獲取人工智能、大數(shù)據(jù)、云計算和物聯(lián)網(wǎng)的前沿資訊和基礎知識，讓我們一起攜手，引領人工智能的未來！

標簽： linux 大數(shù)據(jù) 代碼服務器通信網(wǎng)絡云計算

版權申明：本站文章部分自網(wǎng)絡，如有侵權，請聯(lián)系：west999com@outlook.com
特別注意：本站所有轉(zhuǎn)載文章言論不代表本站觀點！
本站所提供的圖片等素材，版權歸原作者所有，如需使用，請與原作者聯(lián)系。

上一篇:在線應用催生Scale-out存儲提升容量

下一篇:如何實現(xiàn)Hyper-V環(huán)境中的存儲管理

最新資訊

熱門推薦

中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

CUDA開發(fā)常見問題之基礎知識盤點