在法蘭克福舉辦的全球超級計算大會上,重磅消息傳來,NVIDIA宣布CUDA支持Arm CPU,為高性能計算開辟全新途徑,以構建具有極高能效水平的百萬兆級AI超級計算機。北京時間6月17日下午四點,NVIDIA與媒體召開電話會議。下文將詳解雙方合作始末,以及<電子發燒友>獨家求證后獲知的信息。
NVIDIA攜手Arm意欲何在?
隨著傳統計算規模擴展步伐的停止,功率將成為所有超級計算機的限制因素。對于與Arm的攜手,NVIDIA創始人兼首席執行官黃仁勛表示:“NVIDIA CUDA加速的計算和Arm的高能效CPU架構的相結合,將助力HPC社區實現大幅提升,以達到百萬兆級。”雙方合作的原因主要有兩方面:首先,客戶需要更多選擇,一旦完成堆棧優化,Nvidia將加速所有主要CPU架構,包括x86、Power和ARM;其次,通過將NVIDIA軟件棧引入Arm生態系統,將進一步助推在HPC服務器市場的創新。
年底前,NVIDIA將向Arm生態系統提供全堆棧的AI和HPC軟件,該堆棧為600多個HPC應用程序和所有AI框架提供加速,其中包括了所有NVIDIA CUDA-X AI和HPC庫、GPU加速的AI框架和軟件開發工具,如支持OpenACC的PGI編譯器和性能分析器。
NVIDIA解決方案架構與工程團隊副總裁Marc Hamilton透露,NVIDIA和Arm已為這個計劃準備了兩年左右,認為現在是最佳的發布時機。建立在雙方超過10年的合作基礎之上,此前,NVIDIA幾款用于便攜式游戲、自動駕駛汽車、機器人和嵌入式AI計算的系統級芯片產品都采用了Arm。全球眾多涉及超級計算的項目或單位都在尋求Arm的加入,包括歐洲處理器計劃(European Processor Initiative)、日本先進情報項目中心 (RIKEN)、美國能源部的先鋒項目(DOE Vanguard project)等。
合作僅止于HPC軟件方面?還是會進一步影響到某些應用市場?NVIDIA表示,合作同時也是對于其他平臺的補充,例如Jetson Xavier,并將進一步拓展在數據中心和HPC平臺的合作。
超算競爭再加劇
在超級計算機中使用基于Arm的體系結構是值得注意的,和其他架構相比,Arm的一大特色在于出色的能效,能夠為超級計算提供開放式架構,用戶可以實現更為高度的集成。對于需要快速處理和分析大型數據集的研究密集型任務,能夠滿足內存容量和可擴展性需求。Arm已經在世界各地的許多HPC中心獲得了越來越多的關注,NVIDIA支持Arm CPU后,將為研發超算的研究人員們提供了除英特爾和IBM外的第三種選擇,并使得研發者可以通過這種方式獲得更多的自主控制能力。對于已經選擇了Arm CPU的用戶來說,他們同時可以獲得NVIDIA GPU加速計算選項。CUDA強大的軟件能力,將能夠和Arm的軟件生態無縫銜接,強強聯合。
一直以來,Arm并沒有放棄將其處理器擴展至高性能計算領域的堅持。近年來大的舉動有:2016年8月宣布將與日本富士通公司合作,開發一個以64位ARMv8-A驅動的Post K超級計算機,并于當年12月宣布收購Allinea Software公司,后者主要為超級計算機提供性能分析工具。在2018年11月的TOP500列表上,首次出現了Arm的身影,而且是安裝在大名鼎鼎的美國桑迪亞國家實驗室。與此同時,Cray于2018年11月在英國氣象局交付了一臺基于Arm的超級計算機"Isambard",而日本的下一代超級計算機"Post-K"也同樣基于Arm架構。
超算未來將更為注重能耗
超算屆有兩個重要排名:TOP500和Green500。TOP500主要按照性能基準,提供通用高端應用的系統排名。而相比TOP500,Green500除了追求運算速度,更加重視超算的能耗問題。根據今年剛剛發布的Green500排行榜,在全球最節能的25款超級計算機中,有22款都得益于NVIDIA的支持。關鍵因素在于:采用NVIDIA GPU的超級計算機能夠將繁重的處理作業卸載至更為節能的并行處理CUDA GPU之上;NVIDIA與Mellanox合作優化整體超級計算集群的處理;以及NVIDIA發明的SXM 3D封裝和可實現極密集型擴展節點的NVIDIA NVLink互連技術。
攜手打造超豪華“朋友圈”
包括超算中心和系統提供商以及系統級芯片制造商等在內的眾多HPC行業及Arm生態系統中的全球領先企業,都表達了其對于NVIDIA攜手Arm的支持。對于超算百萬兆級時代的愿景,Cray認為主要在于將AI和分析與建模、仿真相結合的系統,這些系統能夠支持、也經常需要為科學、工程和數字化轉型所需的數據密集型工作負載構建的多種處理器架構和系統。Cray系統管理和編程環境(編譯器、庫和工具)已經能夠在XC和未來的Shasta超級計算機上支持Arm處理器,將CUDA和CUDA-X HPC和AI軟件堆棧用于Arm平臺,并將其與Cray系統管理和編程環境緊密集成,能夠助力其超級計算機實現最終愿景。
“歐洲處理器計劃(European Processor Initiative,EPI)總經理Philippe Notton則表示,打造歐盟自己的高端、低功耗、通用和加速器解決方案,EPI和其工業合作伙伴SiPearl非常看好NVIDIA所帶來的全新可能性。將EPI基于Arm的微處理器與NVIDIA加速器相結合,能夠匹配未來歐洲百萬兆級模塊化超級計算機中的構建模塊。”
考慮到未來幾年內百萬兆級系統和大規模AI計算的興起,Jülich超算中心負責人Thomas Lippert表示, NVIDIA對Arm處理器的支持是非常令人興奮的發展,對于實現未來超級計算機和可組合數據中心的真正模塊化至關重要。
在HPC網絡方面處于領先地位的Mellanox Technologies,其InfiniBand和以太網技術連接了全球多款大型的超級計算機,其中就包括第一代基于Arm的各系統。該公司創始人兼首席執行官Eyal Waldman希望通過持續合作,部署200Gb/s HDR和計算網絡技術,以優化HPC和AI工作負載,并實現新一代基于Arm的超級計算機的超級連接。
百萬兆級意義何在?
全球超級計算機競賽正朝著“百萬兆級計算”這個里程碑似的目標前進著。百萬兆級意味著什么?一個百萬兆級的計算機一瞬間進行的計算量,相當于地球上所有人每天每秒都不停地計算四年。
這種非凡的力量將使研究人員能夠進行大規模復雜的模擬,從而在許多領域取得進展,從氣候科學到基因組學、可再生能源和人工智能。田納西大學的超級計算機專家Jack Dongarra曾說過:“百萬兆級的計算機是一項有力的科學工具,就像粒子對撞機或巨型望遠鏡一樣。”這些機器在工業上也很有用,它們可以被用于加速產品設計和識別新材料。軍方和情報機構也渴望這樣的超級計算機能夠將被用于維護國家安全。超級計算機是促進科學發現的重要工具,建立百萬兆級超級計算將能夠極大地擴展人類知識的邊界。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
ARM
+關注
關注
135文章
9553瀏覽量
391883 -
NVIDIA
+關注
關注
14文章
5594瀏覽量
109731 -
超級計算
+關注
關注
1文章
45瀏覽量
11553 -
HPC
+關注
關注
0文章
346瀏覽量
24976 -
CUDA
+關注
關注
0文章
127瀏覽量
14475
發布評論請先 登錄
相關推薦
熱點推薦
借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程
NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設計目標是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的
如何在NVIDIA CUDA Tile中編寫高性能矩陣乘法
本博文是系列課程的一部分,旨在幫助開發者學習 NVIDIA CUDA Tile 編程,掌握構建高性能 GPU 內核的方法,并以矩陣乘法作為核心示例。
在Python中借助NVIDIA CUDA Tile簡化GPU編程
NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發明以來 GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用比 SIMT
NVIDIA CUDA 13.1版本的新增功能與改進
NVIDIA CUDA 13.1 是自 CUDA 二十年前發明以來,規模最大、內容最全面的一次更新。
NVIDIA在Hot Chips 2025大會展示創新技術
本周在加利福尼亞州帕洛阿爾托(Palo Alto)舉行的 Hot Chips 大會上,NVIDIA 專家詳細介紹了 NVIDIA NVLink 和Spectrum-X 以太網技術、Blackwell 以及 CUDA 如何為全球數
AI MCU#兆易創新GD32H7系列MCU解讀
兆易創新GD32H7系列MCU是中國首款基于Arm? Cortex?-M7內核的超高性能微控制器,主打高算力與多場景適配能力,以下從核心特性應用場景及開發生態三方面深度解析: 一核心性能與架構
軟通智算完成超億級A輪融資,加速AI算力產業布局
北京 2025年6月18日 /美通社/ -- 近日,軟通動力旗下軟通智算科技(廣東)集團有限公司(以下簡稱"軟通智算")完成超億級A輪融資,本輪融資由盛景嘉成創投領投,廣發信德、毅達資
NVIDIA B30芯片的核心解讀
以下是關于NVIDIA B30芯片的核心解讀,綜合最新行業信息與分析: 一、 產品定位:中國特供的“精準閹割版”? ? ? 設計目標 ? 專為中國市場定制,旨在規避美國出口管制(如H20芯片被禁
Arm 公司面向 PC 市場的 ?Arm Niva? 深度解讀
面向 PC 市場的 ? Arm Niva ? 深度解讀 ? Arm Niva ? 是 Arm 公司為 PC 市場推出的核心計算平臺,屬于其“平臺優先”戰略的關鍵布局。作為 ?
Arm 公司面向汽車市場的 ?Arm Zena? 深度解讀
面向汽車市場的 ? Arm Zena ? 深度解讀 Arm Zena 是 Arm 公司面向智能汽車領域推出的核心計算平臺,屬于其“平臺優先”戰略的關鍵布局。作為
兆瓦超充已來,40kW模塊急需升級
電子發燒友網報道(文/梁浩斌)比亞迪的兆瓦超充,引爆了充電樁行業,1000kW充電功率的車型落地,將帶動兆瓦級充電樁加速導入市場。除了比亞迪之外,近期行業內其實也有不少
TASKING編譯器全面支持兆易創新GD32A7x車規級MCU
近日,兆易創新 GD32A7x 車規級 MCU 正式獲得 TASKING VX-toolset for Arm v7.1r1 的全面支持。作為業內領先的嵌入式開發工具,TASKING
使用NVIDIA CUDA-X庫加速科學和工程發展
NVIDIA GTC 全球 AI 大會上宣布,開發者現在可以通過 CUDA-X 與新一代超級芯片架構的協同,實現 CPU 和 GPU 資源間深度自動化整合與調度,相較于傳統加速計算架構,該技術可使計算工程工具運行速度提升至原來的 11 倍,計算規模增加至 5 倍。
獨家解讀NVIDIA CUDA支持Arm——百萬兆級超算競爭再加劇?
評論