NVIDIA DGX Rubin 系統(tǒng)整合了 NVIDIA 在計(jì)算、網(wǎng)絡(luò)和軟件領(lǐng)域的最新突破,將推理 token 成本降至 NVIDIA Blackwell 平臺(tái)的十分之一,可加速?gòu)耐评砗陀?xùn)練到長(zhǎng)上下文推理的任意 AI 工作負(fù)載。
NVIDIA DGX SuperPOD 正為基于 NVIDIA Rubin 平臺(tái)構(gòu)建的大規(guī)模系統(tǒng)部署鋪平道路,從而走向 AI 計(jì)算的下一次飛躍。
在 CES 上,NVIDIA 推出了 Rubin 平臺(tái),該平臺(tái)由六款全新芯片組成,旨在打造一臺(tái)超凡的 AI 超級(jí)計(jì)算機(jī),專(zhuān)為加速代理式 AI、混合專(zhuān)家模型 (MoE) 以及長(zhǎng)上下文推理而設(shè)計(jì)。
Rubin 平臺(tái)通過(guò)先進(jìn)的協(xié)同設(shè)計(jì)方法,將六款芯片——NVIDIA Vera CPU、Rubin GPU、NVLink 6 交換機(jī)、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太網(wǎng)交換機(jī)——進(jìn)行了有機(jī)整合,從而加速訓(xùn)練過(guò)程并降低推理 token 生成成本。
不論是企業(yè)還是研究環(huán)境,DGX SuperPOD都可作為部署基于 Rubin 系統(tǒng)的基礎(chǔ)架構(gòu)設(shè)計(jì)參考方案。
NVIDIA DGX 平臺(tái)將從 NVIDIA 計(jì)算到網(wǎng)絡(luò)再到軟件的整個(gè)技術(shù)棧整合為一個(gè)統(tǒng)一協(xié)同的系統(tǒng),消除了基礎(chǔ)設(shè)施集成的負(fù)擔(dān),使團(tuán)隊(duì)能夠?qū)W⒂?AI 創(chuàng)新和業(yè)務(wù)成果。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“當(dāng)前訓(xùn)練和推理的 AI 計(jì)算需求不斷激增,Rubin 的問(wèn)世恰逢其時(shí)。”
為 AI 產(chǎn)業(yè)革命打造的新平臺(tái)
新 DGX 系統(tǒng)采用的Rubin 平臺(tái)引入了五項(xiàng)重大技術(shù)突破,旨在推動(dòng)智能與效率實(shí)現(xiàn)階躍式提升:
第六代 NVIDIA NVLink——每個(gè) GPU 支持 3.6TB/s 的帶寬,每個(gè) Vera Rubin NVL72 機(jī)架總帶寬達(dá) 260TB/s,可支持大規(guī)模 MoE 與長(zhǎng)上下文工作負(fù)載。
NVIDIA Vera CPU——采用了 88 顆 NVIDIA 定制 Olympus 核心打造,完全兼容 Armv9.2,并提供超高速 NVLink-C2C 連接能力,實(shí)現(xiàn)業(yè)界領(lǐng)先的高效 AI 工廠級(jí)計(jì)算能力。
NVIDIA Rubin GPU——搭載具備硬件加速自適應(yīng)壓縮能力的第三代 Transformer 引擎,為 AI 推理提供 50 PFLOPS 的 NVFP4 運(yùn)算能力。
第三代 NVIDIA 機(jī)密計(jì)算——Vera Rubin NVL72 是首個(gè)提供 NVIDIA 機(jī)密計(jì)算的機(jī)架級(jí)平臺(tái),能夠在 CPU、GPU 和 NVLink 域之間的各個(gè)領(lǐng)域保障數(shù)據(jù)安全。
第二代 RAS 引擎——Rubin 平臺(tái)涵蓋 GPU、CPU 和 NVLink,具有實(shí)時(shí)運(yùn)行狀況檢查、容錯(cuò)機(jī)制和主動(dòng)維護(hù)等功能;采用模塊化無(wú)線纜托盤(pán)設(shè)計(jì),使裝配和維護(hù)速度提升 18 倍。
這些創(chuàng)新技術(shù)共同實(shí)現(xiàn)了推理 token 成本最多可降至上一代平臺(tái)的十分之一——隨著 AI 模型在規(guī)模、上下文和推理深度上的不斷擴(kuò)展,這標(biāo)志著一個(gè)關(guān)鍵里程碑。
DGX SuperPOD:為 NVIDIA Rubin 橫向 (Scale-Out) 擴(kuò)展提供藍(lán)圖
基于 Rubin 的 DGX SuperPOD 部署將集成:
NVIDIA DGX Vera Rubin NVL72或DGX Rubin NVL8系統(tǒng)
NVIDIA BlueField- 4 DPU,用于構(gòu)建安全、軟件定義的基礎(chǔ)設(shè)施
NVIDIA 推理上下文記憶存儲(chǔ)平臺(tái),支持下一代推理工作負(fù)載
NVIDIA ConnectX-9 SuperNIC
NVIDIA Quantum-X800 InfiniBand與NVIDIA Spectrum-X 以太網(wǎng)
NVIDIA Mission Control,用于 AI 基礎(chǔ)設(shè)施的自動(dòng)化編排與運(yùn)維
基于 DGX Vera Rubin NVL72 構(gòu)建的 NVIDIA DGX SuperPOD,整合了八個(gè)DGX Vera Rubin NVL72 系統(tǒng),配備 576 個(gè) Rubin GPU,可提供 28.8 ExaFlops 的 FP4 性能和 600TB 的高速內(nèi)存。每個(gè) DGX Vera Rubin NVL72 系統(tǒng)集成了 36 個(gè) Vera CPU、72 個(gè) Rubin GPU 和 18 個(gè) BlueField?4 DPU,可在機(jī)架范圍內(nèi)實(shí)現(xiàn)統(tǒng)一內(nèi)存與計(jì)算空間。憑借 260TB/s 的 NVLink 聚合吞吐量,該系統(tǒng)消除了模型切分需求,使整個(gè)機(jī)架能夠作為統(tǒng)一協(xié)同的 AI 引擎運(yùn)行。
基于 DGX Rubin NVL8 系統(tǒng)構(gòu)建的 NVIDIA DGX SuperPOD,由 64 臺(tái) DGX Rubin NVL8 系統(tǒng)組成,搭載了 512 個(gè)Rubin GPU。NVIDIA DGX Rubin NVL8 系統(tǒng)采用液冷架構(gòu),搭載 x86 CPU,為各類(lèi) AI 項(xiàng)目從開(kāi)發(fā)到部署全流程提供強(qiáng)勁支撐,助力企業(yè)邁入 Rubin 時(shí)代。每臺(tái) DGX Rubin NVL8 配備八塊 NVIDIA Rubin GPU 及第六代 NVLink 技術(shù),其 NVFP4 浮點(diǎn)運(yùn)算能力較 NVIDIA Blackwell 系統(tǒng)提升 5.5 倍。
面向 AI 工廠的下一代網(wǎng)絡(luò)
Rubin 平臺(tái)通過(guò)革命性網(wǎng)絡(luò)架構(gòu)重新定義了數(shù)據(jù)中心,將其打造為高性能 AI 工廠。該平臺(tái)搭載NVIDIA Spectrum-6以太網(wǎng)交換機(jī)、NVIDIA Quantum-X800InfiniBand 交換機(jī)、BlueField-4DPU 及 ConnectX-9 SuperNIC,專(zhuān)為承載全球最龐大的 AI 工作負(fù)載而設(shè)計(jì)。通過(guò)將這些創(chuàng)新技術(shù)集成至 NVIDIA DGX SuperPOD,Rubin 平臺(tái)徹底消除了傳統(tǒng)架構(gòu)在擴(kuò)展性、擁塞及可靠性方面的瓶頸。
針對(duì)大規(guī)模集群優(yōu)化的連接性能
新一代 800Gb/s 端到端網(wǎng)絡(luò)套件為 AI 基礎(chǔ)設(shè)施提供兩條專(zhuān)用路徑,無(wú)論采用 InfiniBand 還是以太網(wǎng)均能確保峰值效率:
NVIDIA Quantum-X800 InfiniBand:為專(zhuān)用 AI 集群提供業(yè)界最低延遲與最高性能。采用 SHARP v4 (Scalable Hierarchical Aggregation and Reduction Protocol) 及自適應(yīng)路由技術(shù),將集合通信操作卸載到網(wǎng)絡(luò)。
NVIDIA Spectrum-X 以太網(wǎng):基于 Spectrum-6 以太網(wǎng)交換機(jī)和 ConnectX-9 SuperNIC 構(gòu)成,該平臺(tái)采用標(biāo)準(zhǔn)以太網(wǎng)協(xié)議,為 AI 工廠提供可預(yù)測(cè)的高性能橫向 (scale-out) 擴(kuò)展與跨區(qū)域 (scale-across) 連接,并針對(duì) AI 工作負(fù)載的“東西向”流量模式進(jìn)行專(zhuān)項(xiàng)優(yōu)化。
打造十億瓦級(jí) AI 工廠
這些創(chuàng)新代表了 Rubin 平臺(tái)的極致協(xié)同設(shè)計(jì)。憑借對(duì)擁塞控制與性能隔離技術(shù)的掌控,NVIDIA 正為下一波十億瓦級(jí) AI 工廠鋪平道路。這種整體化方案確保了當(dāng) AI 模型日益復(fù)雜時(shí),AI 工廠的網(wǎng)絡(luò)架構(gòu)仍能成為速度的催化劑而非瓶頸。
NVIDIA 軟件推動(dòng) AI 工廠運(yùn)營(yíng)與部署
NVIDIA Mission Control——專(zhuān)為基于 NVIDIA Blackwell 架構(gòu)的 DGX 系統(tǒng)設(shè)計(jì)的 AI 數(shù)據(jù)中心運(yùn)維與編排軟件——現(xiàn)已支持基于 Rubin 架構(gòu)的 NVIDIA DGX 系統(tǒng),助力企業(yè)實(shí)現(xiàn)基礎(chǔ)設(shè)施管理的自動(dòng)化與運(yùn)維自動(dòng)化。
NVIDIA Mission Control 可在多方面加速基礎(chǔ)設(shè)施運(yùn)營(yíng),涵蓋配置部署、設(shè)施集成、集群管理及工作負(fù)載調(diào)度。
借助智能集成軟件,企業(yè)可更精準(zhǔn)地掌控 NVIDIA Rubin 的冷卻與供電事項(xiàng),同時(shí)提升基礎(chǔ)設(shè)施彈性。該平臺(tái)通過(guò)快速泄漏檢測(cè)實(shí)現(xiàn)更迅捷的響應(yīng),解鎖 NVIDIA 最新能效創(chuàng)新技術(shù),并憑借自主恢復(fù)功能最大化 AI 工廠的生產(chǎn)力。
NVIDIA DGX 系統(tǒng)還支持NVIDIA AI Enterprise軟件平臺(tái),包括NVIDIA NIM,例如用于 NVIDIA Nemotron-3 系列開(kāi)放模型、數(shù)據(jù)和庫(kù)。
DGX SuperPOD:工業(yè) AI 的未來(lái)之路
DGX SuperPOD 長(zhǎng)期以來(lái)一直是大型 AI 基礎(chǔ)設(shè)施的藍(lán)圖。Rubin 平臺(tái)的問(wèn)世將成為新一代 AI 工廠的起點(diǎn)——這些系統(tǒng)旨在實(shí)現(xiàn)跨數(shù)千步推理,并以顯著降低的成本交付智能,助力企業(yè)構(gòu)建下一代尖端模型、多模態(tài)系統(tǒng)和代理式 AI 應(yīng)用。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5678瀏覽量
110056 -
AI
+關(guān)注
關(guān)注
91文章
40715瀏覽量
302373 -
工作負(fù)載
+關(guān)注
關(guān)注
0文章
14瀏覽量
2125
原文標(biāo)題:CES 2026 | NVIDIA DGX SuperPOD 為基于 Rubin 的系統(tǒng)奠定基礎(chǔ)
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
Jump Trading采用NVIDIA Rubin平臺(tái)大幅提升研究速度
NVIDIA發(fā)布Vera Rubin DSX AI Factory參考設(shè)計(jì)
首屆中國(guó)NVIDIA DGX Spark黑客松大賽開(kāi)啟報(bào)名
微軟Azure數(shù)據(jù)中心國(guó)際版全面對(duì)接NVIDIA Rubin平臺(tái)
NVIDIA Spectrum-X以太網(wǎng)硅光技術(shù)助力AI工廠網(wǎng)絡(luò)創(chuàng)新
NVIDIA在CES 2026上展示未來(lái)藍(lán)圖
Supermicro宣布支持即將推出的NVIDIA Vera Rubin NVL72與HGX Rubin NVL8,并擴(kuò)大機(jī)柜制造產(chǎn)能,提供更佳的液冷AI解決方案
NVIDIA DGX Spark助力構(gòu)建自己的AI模型
在NVIDIA DGX Spark平臺(tái)上對(duì)NVIDIA ConnectX-7 200G網(wǎng)卡配置教程
NVIDIA DGX Spark快速入門(mén)指南
NVIDIA宣布開(kāi)源Aerial軟件
NVIDIA DGX Spark桌面AI計(jì)算機(jī)開(kāi)啟預(yù)訂
NVIDIA DGX SuperPOD為Rubin平臺(tái)橫向擴(kuò)展提供藍(lán)圖
評(píng)論