NVIDIA DGX Rubin 系統(tǒng)整合了 NVIDIA 在計算、網(wǎng)絡和軟件領域的最新突破,將推理 token 成本降至 NVIDIA Blackwell 平臺的十分之一,可加速從推理和訓練到長上下文推理的任意 AI 工作負載。
NVIDIA DGX SuperPOD 正為基于 NVIDIA Rubin 平臺構(gòu)建的大規(guī)模系統(tǒng)部署鋪平道路,從而走向 AI 計算的下一次飛躍。
在 CES 上,NVIDIA 推出了 Rubin 平臺,該平臺由六款全新芯片組成,旨在打造一臺超凡的 AI 超級計算機,專為加速代理式 AI、混合專家模型 (MoE) 以及長上下文推理而設計。
Rubin 平臺通過先進的協(xié)同設計方法,將六款芯片——NVIDIA Vera CPU、Rubin GPU、NVLink 6 交換機、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太網(wǎng)交換機——進行了有機整合,從而加速訓練過程并降低推理 token 生成成本。
不論是企業(yè)還是研究環(huán)境,DGX SuperPOD都可作為部署基于 Rubin 系統(tǒng)的基礎架構(gòu)設計參考方案。
NVIDIA DGX 平臺將從 NVIDIA 計算到網(wǎng)絡再到軟件的整個技術棧整合為一個統(tǒng)一協(xié)同的系統(tǒng),消除了基礎設施集成的負擔,使團隊能夠?qū)W⒂?AI 創(chuàng)新和業(yè)務成果。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“當前訓練和推理的 AI 計算需求不斷激增,Rubin 的問世恰逢其時。”
為 AI 產(chǎn)業(yè)革命打造的新平臺
新 DGX 系統(tǒng)采用的Rubin 平臺引入了五項重大技術突破,旨在推動智能與效率實現(xiàn)階躍式提升:
第六代 NVIDIA NVLink——每個 GPU 支持 3.6TB/s 的帶寬,每個 Vera Rubin NVL72 機架總帶寬達 260TB/s,可支持大規(guī)模 MoE 與長上下文工作負載。
NVIDIA Vera CPU——采用了 88 顆 NVIDIA 定制 Olympus 核心打造,完全兼容 Armv9.2,并提供超高速 NVLink-C2C 連接能力,實現(xiàn)業(yè)界領先的高效 AI 工廠級計算能力。
NVIDIA Rubin GPU——搭載具備硬件加速自適應壓縮能力的第三代 Transformer 引擎,為 AI 推理提供 50 PFLOPS 的 NVFP4 運算能力。
第三代 NVIDIA 機密計算——Vera Rubin NVL72 是首個提供 NVIDIA 機密計算的機架級平臺,能夠在 CPU、GPU 和 NVLink 域之間的各個領域保障數(shù)據(jù)安全。
第二代 RAS 引擎——Rubin 平臺涵蓋 GPU、CPU 和 NVLink,具有實時運行狀況檢查、容錯機制和主動維護等功能;采用模塊化無線纜托盤設計,使裝配和維護速度提升 18 倍。
這些創(chuàng)新技術共同實現(xiàn)了推理 token 成本最多可降至上一代平臺的十分之一——隨著 AI 模型在規(guī)模、上下文和推理深度上的不斷擴展,這標志著一個關鍵里程碑。
DGX SuperPOD:為 NVIDIA Rubin 橫向 (Scale-Out) 擴展提供藍圖
基于 Rubin 的 DGX SuperPOD 部署將集成:
NVIDIA DGX Vera Rubin NVL72或DGX Rubin NVL8系統(tǒng)
NVIDIA BlueField- 4 DPU,用于構(gòu)建安全、軟件定義的基礎設施
NVIDIA 推理上下文記憶存儲平臺,支持下一代推理工作負載
NVIDIA ConnectX-9 SuperNIC
NVIDIA Quantum-X800 InfiniBand與NVIDIA Spectrum-X 以太網(wǎng)
NVIDIA Mission Control,用于 AI 基礎設施的自動化編排與運維
基于 DGX Vera Rubin NVL72 構(gòu)建的 NVIDIA DGX SuperPOD,整合了八個DGX Vera Rubin NVL72 系統(tǒng),配備 576 個 Rubin GPU,可提供 28.8 ExaFlops 的 FP4 性能和 600TB 的高速內(nèi)存。每個 DGX Vera Rubin NVL72 系統(tǒng)集成了 36 個 Vera CPU、72 個 Rubin GPU 和 18 個 BlueField?4 DPU,可在機架范圍內(nèi)實現(xiàn)統(tǒng)一內(nèi)存與計算空間。憑借 260TB/s 的 NVLink 聚合吞吐量,該系統(tǒng)消除了模型切分需求,使整個機架能夠作為統(tǒng)一協(xié)同的 AI 引擎運行。
基于 DGX Rubin NVL8 系統(tǒng)構(gòu)建的 NVIDIA DGX SuperPOD,由 64 臺 DGX Rubin NVL8 系統(tǒng)組成,搭載了 512 個Rubin GPU。NVIDIA DGX Rubin NVL8 系統(tǒng)采用液冷架構(gòu),搭載 x86 CPU,為各類 AI 項目從開發(fā)到部署全流程提供強勁支撐,助力企業(yè)邁入 Rubin 時代。每臺 DGX Rubin NVL8 配備八塊 NVIDIA Rubin GPU 及第六代 NVLink 技術,其 NVFP4 浮點運算能力較 NVIDIA Blackwell 系統(tǒng)提升 5.5 倍。
面向 AI 工廠的下一代網(wǎng)絡
Rubin 平臺通過革命性網(wǎng)絡架構(gòu)重新定義了數(shù)據(jù)中心,將其打造為高性能 AI 工廠。該平臺搭載NVIDIA Spectrum-6以太網(wǎng)交換機、NVIDIA Quantum-X800InfiniBand 交換機、BlueField-4DPU 及 ConnectX-9 SuperNIC,專為承載全球最龐大的 AI 工作負載而設計。通過將這些創(chuàng)新技術集成至 NVIDIA DGX SuperPOD,Rubin 平臺徹底消除了傳統(tǒng)架構(gòu)在擴展性、擁塞及可靠性方面的瓶頸。
針對大規(guī)模集群優(yōu)化的連接性能
新一代 800Gb/s 端到端網(wǎng)絡套件為 AI 基礎設施提供兩條專用路徑,無論采用 InfiniBand 還是以太網(wǎng)均能確保峰值效率:
NVIDIA Quantum-X800 InfiniBand:為專用 AI 集群提供業(yè)界最低延遲與最高性能。采用 SHARP v4 (Scalable Hierarchical Aggregation and Reduction Protocol) 及自適應路由技術,將集合通信操作卸載到網(wǎng)絡。
NVIDIA Spectrum-X 以太網(wǎng):基于 Spectrum-6 以太網(wǎng)交換機和 ConnectX-9 SuperNIC 構(gòu)成,該平臺采用標準以太網(wǎng)協(xié)議,為 AI 工廠提供可預測的高性能橫向 (scale-out) 擴展與跨區(qū)域 (scale-across) 連接,并針對 AI 工作負載的“東西向”流量模式進行專項優(yōu)化。
打造十億瓦級 AI 工廠
這些創(chuàng)新代表了 Rubin 平臺的極致協(xié)同設計。憑借對擁塞控制與性能隔離技術的掌控,NVIDIA 正為下一波十億瓦級 AI 工廠鋪平道路。這種整體化方案確保了當 AI 模型日益復雜時,AI 工廠的網(wǎng)絡架構(gòu)仍能成為速度的催化劑而非瓶頸。
NVIDIA 軟件推動 AI 工廠運營與部署
NVIDIA Mission Control——專為基于 NVIDIA Blackwell 架構(gòu)的 DGX 系統(tǒng)設計的 AI 數(shù)據(jù)中心運維與編排軟件——現(xiàn)已支持基于 Rubin 架構(gòu)的 NVIDIA DGX 系統(tǒng),助力企業(yè)實現(xiàn)基礎設施管理的自動化與運維自動化。
NVIDIA Mission Control 可在多方面加速基礎設施運營,涵蓋配置部署、設施集成、集群管理及工作負載調(diào)度。
借助智能集成軟件,企業(yè)可更精準地掌控 NVIDIA Rubin 的冷卻與供電事項,同時提升基礎設施彈性。該平臺通過快速泄漏檢測實現(xiàn)更迅捷的響應,解鎖 NVIDIA 最新能效創(chuàng)新技術,并憑借自主恢復功能最大化 AI 工廠的生產(chǎn)力。
NVIDIA DGX 系統(tǒng)還支持NVIDIA AI Enterprise軟件平臺,包括NVIDIA NIM,例如用于 NVIDIA Nemotron-3 系列開放模型、數(shù)據(jù)和庫。
DGX SuperPOD:工業(yè) AI 的未來之路
DGX SuperPOD 長期以來一直是大型 AI 基礎設施的藍圖。Rubin 平臺的問世將成為新一代 AI 工廠的起點——這些系統(tǒng)旨在實現(xiàn)跨數(shù)千步推理,并以顯著降低的成本交付智能,助力企業(yè)構(gòu)建下一代尖端模型、多模態(tài)系統(tǒng)和代理式 AI 應用。
-
NVIDIA
+關注
關注
14文章
5592瀏覽量
109717 -
AI
+關注
關注
91文章
39755瀏覽量
301359 -
工作負載
+關注
關注
0文章
14瀏覽量
2123
原文標題:CES 2026 | NVIDIA DGX SuperPOD 為基于 Rubin 的系統(tǒng)奠定基礎
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
微軟Azure數(shù)據(jù)中心國際版全面對接NVIDIA Rubin平臺
英偉達Rubin平臺引入微通道冷板技術,100%全液冷設計
NVIDIA Spectrum-X以太網(wǎng)硅光技術助力AI工廠網(wǎng)絡創(chuàng)新
NVIDIA在CES 2026上展示未來藍圖
Supermicro宣布支持即將推出的NVIDIA Vera Rubin NVL72與HGX Rubin NVL8,并擴大機柜制造產(chǎn)能,提供更佳的液冷AI解決方案
NVIDIA DGX Spark助力構(gòu)建自己的AI模型
在NVIDIA DGX Spark平臺上對NVIDIA ConnectX-7 200G網(wǎng)卡配置教程
NVIDIA DGX Spark快速入門指南
NVIDIA宣布開源Aerial軟件
NVIDIA DGX Spark桌面AI計算機開啟預訂
Cadence 借助 NVIDIA DGX SuperPOD 模型擴展數(shù)字孿生平臺庫,加速 AI 數(shù)據(jù)中心部署與運營
NVIDIA推出AI平臺DGX Cloud Lepton
NVIDIA發(fā)布AI優(yōu)先DGX個人計算系統(tǒng)
NVIDIA GTC2025 亮點 NVIDIA推出 DGX Spark個人AI計算機
NVIDIA 宣布推出 DGX Spark 個人 AI 計算機
NVIDIA DGX SuperPOD為Rubin平臺橫向擴展提供藍圖
評論