3月19日凌晨,NVIDIA 創始人兼首席執行官黃仁勛在2025年GTC開發者大會上發表了主題演講,演講覆蓋了AI科技演進以及計算需求,同時公布了英偉達的Blackwell架構最新一代產品、未來幾代產品的計劃出貨時間,以及英偉達在人形機器人領域的最新進展。

圖源:英偉達官方視頻,下同
演講期間,黃仁勛再次提到AI技術的進化路徑,從 Perception 感知AI到 Generative生成式AI,再到現階段發展火熱Agentic代理型AI,最終實現具備傳感與執行功能的Physical 物理型AI。黃仁勛認為AI的終極形態Physical AI將徹底改變世界。
以下是演講的核心內容與關鍵發布:
一、硬件革新:Blackwell架構及未來路線圖
Blackwell Ultra芯片
采用臺積電4NP工藝,單卡FP4算力達15 PetaFLOPS,HBM3e顯存容量提升至288GB,推理速度較前代Hopper提升11倍8。
機架級解決方案GB300 NVL72集成72顆GPU,支持液冷技術,推理性能達每秒1000 tokens(H100的10倍)。性能提升源于NVLink 72高速互聯技術,將多GPU組合成“巨型GPU”,突破算力瓶頸。
未來架構規劃
Rubin架構(2026年發布):采用NVLink 144互聯技術,HBM4內存帶寬提升2倍,2027年Ultra版性能將達Blackwell的14倍。
Feynman架構(2028年):以物理學家費曼命名,目標實現算力成本指數級下降。
二、軟件生態與工具升級
Dynamo推理操作系統
開源動態調度系統,優化GPU資源分配,使Hopper平臺運行Llama模型的吞吐量提升30倍,并支持KV緩存管理。在DeepSeek-R1模型測試中,單GPU生成token數量提升30倍以上。
CUDA生態擴展
CUDA-X庫新增工具:Newton物理引擎(與DeepMind、迪士尼合作):提升機器人訓練效率10倍。
cuOpt數學規劃工具:加速千倍,已與Gurobi、IBM合作。
開發者生態:全球開發者突破600萬,加速庫增至900+,覆蓋量子計算、生物醫學等領域。
三、AI發展階段論與物理AI的推進
AI三階段演進路徑
感知人工智能(Perception AI):大約10年前啟動,專注于語音識別和其他簡單任務。
生成式人工智能(Generative AI):過去5年的重點,涉及通過預測模式進行文本和圖像創建。
代理人工智能(Agentic AI):人工智能以數字方式交互并自主執行任務的當前階段,以推理模型為特征。
物理 AI(Physical AI):AI 的未來,為人形機器人和現實世界的應用提供動力。
物理AI落地實踐
開源人形機器人基礎模型Isaac GR00T N1:支持雙系統認知(慢思考規劃+快思考執行),可遷移至工業制造場景。
與通用汽車合作構建全棧自動駕駛系統:覆蓋數字孿生仿真與車載AI安全架構HALOS。
四、行業應用與合作案例
企業級AI解決方案
DGX Spark:售價3000美元的桌面級工作站,支持本地化模型微調。
語義存儲系統:與Box合作,支持自然語言數據檢索。
邊緣與通信技術
聯合思科、T-Mobile構建AI-RAN(AI無線網絡),優化5G信號處理與能耗。
硅光子技術突破:全球首個1.6T共封裝光學(CPO),減少數據中心光模塊功耗90%。
硬件創新:Blackwell架構引領算力飛躍
黃仁勛宣布Blackwell架構已全面投產,其性能和能效相比前代Hopper架構都有顯著提升?;谂_積電4NP工藝的Blackwell Ultra芯片(B300系列)正式發布,單卡FP4算力達15 PetaFLOPS,HBM3E顯存容量提升至288GB,推理速度較前代Hopper提升11倍。Blackwell Ultra包括NVIDIA GB300 NVL72機架級解決方案和NVIDIA HGXT B300 NVL16系統。GB300 NVL72與上一代NVIDIA GB200 NL72相比,AI的性能提升5倍。GB300 NVL72連接了72個Blackwell Ultra GPU與36個基于Arm Neoverse的Grace CPU;NVIDIA HGX B300 NVL16與上一代相比,在大型語言模型上具有11倍推理速度、4倍內存,可以為AI推理等復雜的工作負載提供突破性的性能。機架級解決方案GB300 NVL72集成72顆GPU,支持液冷技術,推理性能達每秒1000 tokens,已獲亞馬遜AWS、微軟Azure等四大云廠商360萬片訂單。此外,英偉達還公布了下一代GPU架構Vera Rubin和Feynman的路線圖,Vera Rubin架構計劃于2026年推出,采用NVLink 144互聯技術,HBM4內存帶寬提升2倍;2028年發布的Feynman架構,目標實現算力成本指數級下降。

軟件生態Dynamo與CUDA-X驅動開發效率
英偉達推出了開源推理軟件Dynamo,它可將Hopper平臺運行Llama模型的吞吐量提升30倍,支持動態分配GPU資源,優化KV緩存管理。在DeepSeek-R1模型測試中,Dynamo使GB200 NVL72集群的單GPU生成token數量提升30倍以上。CUDA-X庫新增Newton物理引擎,與DeepMind、迪士尼合作開發,機器人訓練效率提升10倍;cuOpt數學規劃工具加速千倍。全球開發者突破600萬,加速庫數量增至900+,覆蓋量子計算、生物醫學等前沿領域。

從自主型人工智能推理革命走向物理人工智能
黃仁勛闡述了AI發展的三階段演進路徑:從感知AI(Perception AI)的計算機視覺和語音識別,到生成式AI(Generative AI)的多模態內容生成,再到當下熱門的代理式AI(Agentic AI),其具備主動性,能感知并理解語境,制定并執行計劃。未來則是物理AI(Physical AI)的時代,理解物理世界、三維世界的AI將推動機器人、自動駕駛等領域的發展。

演講期間,英偉達推出了開源人形機器人基礎模型Isaac GR00T N1,支持雙系統認知,可遷移至工業制造場景。同時,英偉達與通用汽車合作構建全棧自動駕駛系統,覆蓋數字孿生仿真與車載AI安全架構HALOS。

推動CUDA生態進化
英偉達在AI for Science領域的布局持續加深,開發人員現在可以利用CUDA-X與最新的superchip架構實現CPU和GPU資源之間更緊密的自動集成與協調,與使用傳統加速計算架構相比,其工程計算工具的速度提高11倍,計算量提高5倍。CUDA-X目前已經在天文學、粒子物理學、量子物理學、汽車、航空航天和半導體設計等一系列新的工程學科帶來了加速計算。
AI工廠時代到來
黃仁勛特別強調了AI工廠的概念,Dynamo被比作新時代的VMware,能夠自動編排如何讓AI在推理時代跑得更好。英偉達還推出了AI電腦DGX Spark和DGX Station,采用Blackwell芯片,助力企業構建更高效的AI基礎設施。

小結
黃仁勛的演講全面展示了英偉達在AI領域的技術實力和戰略布局,從硬件的持續創新到軟件生態的完善,再到對AI發展階段的深刻洞察,英偉達正致力于推動AI技術從從自主型人工智能推理革命走向物理人工智能終局。
-
NVIDIA
+關注
關注
14文章
5592瀏覽量
109714 -
AI
+關注
關注
91文章
39755瀏覽量
301350 -
人工智能
+關注
關注
1817文章
50094瀏覽量
265263
發布評論請先 登錄
Rubin平臺官宣量產!黃仁勛:機器人的ChatGPT時刻已至
中國AI市場有望達500億美元!黃仁勛:錯失中國市場將損失巨大
黃仁勛新年第一場演講提了DeepSeek 黃仁勛:機器人領域迎來ChatGPT時刻
NVIDIA CEO黃仁勛暢談AI時代最新藍圖
央視專訪英偉達創始人黃仁勛 黃仁勛:總感覺公司快倒閉了
黃仁勛用中文演講全文分享 中國人工智能模型世界一流 黃仁勛中文演講提了11家中國公司
NVIDIA CEO 黃仁勛在美國和中國推廣 AI
NVIDIA英偉達 GTC 巴黎亮點:NVIDIA CEO黃仁勛公布歐洲AI發展新藍圖
NVIDIA CEO黃仁勛展望AI基礎設施產業
黃仁勛:人工智能將提高全球GDP 黃仁勛談中國AI市場未來規模可達500億美元
NVIDIA GTC 2025精華一文讀完 黃仁勛在GTC上的主題演講
黃仁勛GTC2025演講:人工智能的終極形態物理AI將徹底改變世界
評論