十幾年前,還不曾有加速應用程序。而如今已有近600個應用程序通過NVIDIA GPU實現了提速。
這些應用程序涵蓋了物理、生物科學、分子動力學、化學和天氣預報等各個領域。其中包括全球最熱門的15個高性能計算應用程序,也都是通過GPU實現加速的。去年,NVIDIA GPU應用程序目錄收錄了100多個應用程序,接下來還會有更多的程序將被陸續添加到目錄中。

Intersect 360研究所的一份報告中收錄了數據中心運行的各個關鍵應用程序。其中,排名前15的應用程序均由GPU加速,這些都是一系列殺手級的核心科學應用程序。其中包括:
GROMACS(化學)– 分子動力學應用程序,旨在模擬包含了數百到數百萬個粒子的系統的牛頓運動方程。
ANSYS(流體動力學分析)– 模擬液體和氣體與表面的相互作用。
Gaussian(化學)– 預測分子系統的能量、分子結構和振動頻率。
VASP(化學)– 用于從頭計算法量子力學分子動力學模擬。
NAMD(化學)– 大型生物分子系統的高性能模擬。
Simulia Abaqus(結構分析)– 用于結構力學的模擬和分析。
WRF(天氣/環境建模)– 數值天氣預報系統,專為大氣研究和操作預測應用程序而設計。
OpenFOAM(流體動力學分析)– 通用型 CFD 軟件的求解器庫。
ANSYS(結構分析)– 對高頻和高速電子元件中的 3D 全波電磁場進行建模。
LS-DYNA(結構分析)– 結構力學的模擬和分析工具。
BLAST(生物科學)– 應用最為廣泛的生物信息學工具之一。
LAMMPS(化學)– 經典分子動力學程序包。
Amber(化學)– 專門針對生物分子系統模擬而開發的分子動力學應用程序。
Quantum Espresso(化學)– 一套集成的計算機代碼,用于電子結構計算和納米級材料建模。
GAMESS(化學)– 用于模擬原子和分子電子結構的計算化學套件。
這些工具本身無法實現性能的遞增性提升。但通過采用NVIDIA GPU的服務器,其性能通常可提高10 倍或更多。并且,GPU加速可以改善數據中心的經濟效益。
預測天氣
天氣預報是一項遠比其看起來更加困難的工作。天氣預報是高性能計算領域的一個重要分支。準確可靠的天氣預報不僅可以拯救生命,還有助于航空、能源和公用事業、保險、零售和其他行業做出經濟決策。
天氣預報需要大量的計算資源,包括幾何尺度(尤其是全球天氣預報),和大量描述大氣狀態的變量。
但是,受限于可用的計算量和應用程序的性能,當前的天氣預報模型僅限于低分辨率的模擬,例如12公里的分辨率。
這些模型忽略了一些重要的細節,例如云層的影響(云層可以反射太陽輻射,在天氣模式中扮演著重要的角色)。采用1公里云分辨率可以改善預測效果,但這需要 應用程序的性能提升1700倍。
GPU加速可以彌補此差距,提高天氣預報的準確性。
加速空氣動力學模擬
使用NASA的FUN3D代碼模擬SLS Block 1B助推器分離流場。該圖片由Jamie Meeroff,Henry Lee,NASA/Ames提供。
火箭能夠以超高的速度飛行,然而利用大規模空氣動力學模擬,我們可以對其進行改進,讓火箭可以飛得更快、更高效。
NASA蘭利研究中心開發的FUN3D計算流體動力學軟件,可用于模擬各種空氣動力學應用程序中的流體流動。該應用程序在NASA Pleiades超級計算機上消耗的周期比其他任何應用程序都要多。借助于GPU加速,采用了6個NVIDIA V100 Tensor Core GPU的服務器能夠以高出雙插槽CPU服務器30倍的性能運行這些模擬。
總結:GPU具備非常好的性能,從而高效地計算規模更大、更復雜的模擬。NASA已經證明,在Summit超級計算機上,僅需運行1000臺GPU服務器就可以完成100多萬個CPU核心的工作。而且,其能源成本遠低于CPU。
性能持續提升
我們在各個加速計算領域都擁有深厚的儲備。結合由100多萬名開發人員組成的生態系統,我們將共同形成一個不斷改進的平臺。該平臺可以在相同的 GPU加速服務器上提供更高的應用程序性能。
例如,在包含 11 個高性能計算應用程序的組合中,對于采用4個NVIDIA Tesla P100 GPU的服務器,其當前的運行速度比兩年前提高了2倍。如果同時改進軟件堆棧和GPU架構,您可以獲得更大的性能提升。
-
NVIDIA
+關注
關注
14文章
5592瀏覽量
109722 -
gpu
+關注
關注
28文章
5194瀏覽量
135433
原文標題:GPU已加速的近600個高性能計算應用程序都有哪些?
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程
NVIDIA RTX PRO 5000 Blackwell GPU的深度評測
NVIDIA RTX PRO 4000 Blackwell GPU性能測試
在Python中借助NVIDIA CUDA Tile簡化GPU編程
NVIDIA RTX PRO 2000 Blackwell GPU性能測試
NVIDIA Isaac Lab多GPU多節點訓練指南
學生適合使用的SOLIDWORKS 云應用程序
DeepSeek R1 MTP在TensorRT-LLM中的實現與優化
NVIDIA RTX PRO 4500 Blackwell GPU測試分析
NVIDIA桌面GPU系列擴展新產品
NVIDIA Blackwell GPU優化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀錄
近600個應用程序通過NVIDIA GPU實現了提速
評論