NVIDIA全新CUDA 4.0簡化平行運算編程作業

NVIDIA全新CUDA 4.0簡化平行運算編程作業

NVIDIA宣佈推出最新版NVIDIA CUDA工具套件,鎖定運用NVIDIA繪圖處理器(GPU)開發平行運算應用,為開發者提供更多工具和全新功能。NVIDIA CUDA 4.0工具套件可將平行運算編程變得更容易。

並可讓開發者將應用植入GPU內,成就以下三項主要特色:
.NVIDIA GPUDirect™ 2.0技術-可在單一伺服器或工作站中支援GPU對GPU的傳輸。這可讓多重GPU編程變得更容易、更快,並可確保應用程式的效能。
.統一虛擬位址技術(UVA)-可針對主系統記憶體和GPU內建記憶體提供單一合併記憶體位址空間,讓平行運算編程變得更快、更容易。
.hrust C++樣本效能原生程式庫-提供一系列效能強勁的開放原始碼C++平行運算演算法,以及可為C++開發者提供更容易進行編程的資料架構。如平行運算分類等一般作業,透過Thrust可比採用標準樣本庫(STL)和執行緒結構模組(TBB)執行的分類作業快5到100倍不等。

 

Quantifi公司利率產品部門總監Peter Decrem表示:「透過標準格式介面運用GPU運算,讓眾多作業皆可大幅提升效能,從簡單的現金流量計算到複雜的Libor倫敦同業拆款市場模型、變動年金或資本化信用價值調整(CVA)等都可受惠。在Thrust C++函式庫納入記憶體存取和配置等低階功能後,已大大地降低了進入的門檻,讓金融工程師可針對GPU加速的環境專注開發演算法。」CUDA 4.0架構包括了許多其他主要特色和功能,包括:
.MPI與CUDA應用之整合-修正後的MPI配置,像OpenMPI等,可在應用程式送出或接收一個MPI指令時,運用Infiniband 自動將資料在系統與GPU記憶體之間傳送。
.GPU的多重執行緒共享功能-多個CPU主執行緒可以在單一的GPU中分享各種使用情境,讓多緒應用更容易共用一個GPU。
.單一CPU執行緒共享多重GPU-單一CPU主執行緒可以存取所有系統中的GPU。開發人員可以針對應用程式內的「halo」交換等作業輕鬆地進行協調。
.全新NPP影像與電腦視覺函式庫-一套提供豐富工具的影像轉換作業,為各種影像和電腦視覺應用提供快速的開發環境。
.全新改良功能包括:在Visual Profiler提供自動效能分析、在cuda-gdb內提供全新功能,並加入針對MacOS作業系統的支援、加入針對新增/刪除等C++功能和虛擬功能的支援、全新GPU二位元反彙編器。

報馬仔
作者

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則