在 GTC 會場,觀眾座無虛席,兩位計算領域最具影響力的領導人物,NVIDIA 首席科學家 Bill Dally,以及 Google DeepMind 與 Google Research 首席科學家 Jeff Dean 登臺對話。他們的工作深刻塑造了大規模機器學習的發展軌跡。
這場對話與其說是傳統座談,不如說是一場深度學習的“即興演奏會”,兩位深入探討了 AI 模型的演進方向,以及為何硬件架構如今已與 AI 的進步密不可分。
Dean 開場時回顧了模型能力的快速躍遷,尤其在如“數學和編程”等具備“可驗證獎勵”的領域。曾經令模型束手無策的任務,如今已能可靠地執行;基于智能體的工作流甚至能在數小時乃至數天內幾乎無需人工干預的情況下自主運行。他強調,這一轉變正在重塑 AI 系統的本質,使其從被動響應提示的工具,轉變為“在后臺持續運作的智能體”。
對此,Dally 表示,這種演進將延遲問題推至聚光燈下。推理速度成為智能體在大規模環境中推理、規劃與迭代的首要設計約束。他解釋道,當前大部分延遲并非來自計算本身,而是源于通信。每一層之間的數據傳遞、每一次片外訪問、每比特在導線上的移動,都會帶來時間與能耗成本。NVIDIA 的應對策略是推動架構向 Dally 所稱的“光速”設計邁進:最大限度減少路由成本、消除排隊等待,并縮短數據必須傳輸的物理距離。
在討論能效時,這一“不要移動數據”的原則被反復提及。一次乘加運算可能僅耗幾飛焦耳(極小的能量單位),但從外部存儲器讀取數據的能耗卻可能高出數千倍。Dally 介紹了利用 SRAM 的局部性并探索堆疊式 DRAM 技術,通過將計算單元緊鄰內存部署,從根本上改善這一能耗失衡。其目標不僅是降低能耗,更是在相同功耗下實現更高性能。
討論還延伸到利用 AI 設計運行 AI 的芯片。Dally 舉例說,如今強化學習系統能夠在一夜之間生成標準單元庫,即預設計、預驗證且完整表征的基礎邏輯模塊集合;而基于 NVIDIA 設計歷史訓練的內部大語言模型,正幫助初級工程師掌握數十年的架構知識。這些系統并非取代人類設計師,而是增強他們的能力,壓縮開發周期,并拓展值得探索的創新空間。
展望未來,兩位演講者不約而同地聚焦于同一個關鍵詞:協同設計。突破性的進展將來自機器學習研究人員與系統架構師之間的緊密反饋循環。正如 Dean 所言,有時你在硅片上加入一個小型實驗性功能,就可能帶來巨大回報,硬件性能可因此實現“10 到 20 倍”的提升。
本場對話最終回歸人本價值。教育、醫療與科學發現被一致視為 AI 能產生深遠積極影響的領域,尤其是當系統變得個性化、具備上下文理解并持續學習的情況下。Dean 表示,“我認為 AI 在醫療領域的應用將極具變革性”。
如果臺上這兩位行業領導者所暢想的未來成真,那將不只是更快的模型運行在更好的硬件上,而將開啟一個一個智能、能效與規模協同演進的全新計算時代。
-
NVIDIA
+關注
關注
14文章
5678瀏覽量
110058 -
AI
+關注
關注
91文章
40715瀏覽量
302379 -
模型
+關注
關注
1文章
3805瀏覽量
52232
原文標題:GTC2026 | 當 AI 遇見光速:NVIDIA Bill Dally 與 Google Jeff Dean 共話未來
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
NVIDIA 成立由全球領先 AI 實驗室組成的 Nemotron Coalition,推動開放前沿模型發展
NVIDIA 擴展開放模型系列,推動代理式、物理和醫療 AI 下一階段發展
NVIDIA Jetson模型賦能AI在邊緣端落地
NVIDIA推出代理式AI藍圖與電信推理模型
NVIDIA推動面向數字與物理AI的開源模型發展
利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發
NVIDIA 利用全新開源模型與仿真庫加速機器人研發進程
什么是AI模型的推理能力
使用NVIDIA NVLink Fusion技術提升AI推理性能
【下載】5G/6G 公開資料整理|AI/ML、NTN、ISAC 等方向(持續更新)
NVIDIA通過全新 Omniverse庫、Cosmos物理AI模型及AI計算基礎設施,為機器人領域開啟新篇章
NVIDIA與Google探討AI模型的演進方向
評論