久久见久久久国产精品蜜桃,国产精品va一区二区三区影片,一本狠狠久久五月色丁香综合

NVIDIA DGX Rubin 系統(tǒng)整合了 NVIDIA 在計(jì)算、網(wǎng)絡(luò)和軟件領(lǐng)域的最新突破，將推理 token 成本降至 NVIDIA Blackwell 平臺(tái)的十分之一，可加速?gòu)耐评砗陀?xùn)練到長(zhǎng)上下文推理的任意 AI 工作負(fù)載。

NVIDIA DGX SuperPOD 正為基于 NVIDIA Rubin 平臺(tái)構(gòu)建的大規(guī)模系統(tǒng)部署鋪平道路，從而走向 AI 計(jì)算的下一次飛躍。

在 CES 上，NVIDIA 推出了 Rubin 平臺(tái)，該平臺(tái)由六款全新芯片組成，旨在打造一臺(tái)超凡的 AI 超級(jí)計(jì)算機(jī)，專(zhuān)為加速代理式 AI、混合專(zhuān)家模型 (MoE) 以及長(zhǎng)上下文推理而設(shè)計(jì)。

Rubin 平臺(tái)通過(guò)先進(jìn)的協(xié)同設(shè)計(jì)方法，將六款芯片——NVIDIA Vera CPU、Rubin GPU、NVLink 6 交換機(jī)、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太網(wǎng)交換機(jī)——進(jìn)行了有機(jī)整合，從而加速訓(xùn)練過(guò)程并降低推理 token 生成成本。

不論是企業(yè)還是研究環(huán)境，DGX SuperPOD都可作為部署基于 Rubin 系統(tǒng)的基礎(chǔ)架構(gòu)設(shè)計(jì)參考方案。

NVIDIA DGX 平臺(tái)將從 NVIDIA 計(jì)算到網(wǎng)絡(luò)再到軟件的整個(gè)技術(shù)棧整合為一個(gè)統(tǒng)一協(xié)同的系統(tǒng)，消除了基礎(chǔ)設(shè)施集成的負(fù)擔(dān)，使團(tuán)隊(duì)能夠?qū)Ｗ⒂?AI 創(chuàng)新和業(yè)務(wù)成果。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示：“當(dāng)前訓(xùn)練和推理的 AI 計(jì)算需求不斷激增，Rubin 的問(wèn)世恰逢其時(shí)。”

為 AI 產(chǎn)業(yè)革命打造的新平臺(tái)

新 DGX 系統(tǒng)采用的Rubin 平臺(tái)引入了五項(xiàng)重大技術(shù)突破，旨在推動(dòng)智能與效率實(shí)現(xiàn)階躍式提升：

第六代 NVIDIA NVLink——每個(gè) GPU 支持 3.6TB/s 的帶寬，每個(gè) Vera Rubin NVL72 機(jī)架總帶寬達(dá) 260TB/s，可支持大規(guī)模 MoE 與長(zhǎng)上下文工作負(fù)載。

NVIDIA Vera CPU——采用了 88 顆 NVIDIA 定制 Olympus 核心打造，完全兼容 Armv9.2，并提供超高速 NVLink-C2C 連接能力，實(shí)現(xiàn)業(yè)界領(lǐng)先的高效 AI 工廠級(jí)計(jì)算能力。

NVIDIA Rubin GPU——搭載具備硬件加速自適應(yīng)壓縮能力的第三代 Transformer 引擎，為 AI 推理提供 50 PFLOPS 的 NVFP4 運(yùn)算能力。

第三代 NVIDIA 機(jī)密計(jì)算——Vera Rubin NVL72 是首個(gè)提供 NVIDIA 機(jī)密計(jì)算的機(jī)架級(jí)平臺(tái)，能夠在 CPU、GPU 和 NVLink 域之間的各個(gè)領(lǐng)域保障數(shù)據(jù)安全。

第二代 RAS 引擎——Rubin 平臺(tái)涵蓋 GPU、CPU 和 NVLink，具有實(shí)時(shí)運(yùn)行狀況檢查、容錯(cuò)機(jī)制和主動(dòng)維護(hù)等功能；采用模塊化無(wú)線纜托盤(pán)設(shè)計(jì)，使裝配和維護(hù)速度提升 18 倍。

這些創(chuàng)新技術(shù)共同實(shí)現(xiàn)了推理 token 成本最多可降至上一代平臺(tái)的十分之一——隨著 AI 模型在規(guī)模、上下文和推理深度上的不斷擴(kuò)展，這標(biāo)志著一個(gè)關(guān)鍵里程碑。

DGX SuperPOD：為 NVIDIA Rubin 橫向 (Scale-Out) 擴(kuò)展提供藍(lán)圖

基于 Rubin 的 DGX SuperPOD 部署將集成：

NVIDIA DGX Vera Rubin NVL72或DGX Rubin NVL8系統(tǒng)

NVIDIA BlueField- 4 DPU，用于構(gòu)建安全、軟件定義的基礎(chǔ)設(shè)施

NVIDIA 推理上下文記憶存儲(chǔ)平臺(tái)，支持下一代推理工作負(fù)載

NVIDIA ConnectX-9 SuperNIC

NVIDIA Quantum-X800 InfiniBand與NVIDIA Spectrum-X 以太網(wǎng)

NVIDIA Mission Control，用于 AI 基礎(chǔ)設(shè)施的自動(dòng)化編排與運(yùn)維

基于 DGX Vera Rubin NVL72 構(gòu)建的 NVIDIA DGX SuperPOD，整合了八個(gè)DGX Vera Rubin NVL72 系統(tǒng)，配備 576 個(gè) Rubin GPU，可提供 28.8 ExaFlops 的 FP4 性能和 600TB 的高速內(nèi)存。每個(gè) DGX Vera Rubin NVL72 系統(tǒng)集成了 36 個(gè) Vera CPU、72 個(gè) Rubin GPU 和 18 個(gè) BlueField?4 DPU，可在機(jī)架范圍內(nèi)實(shí)現(xiàn)統(tǒng)一內(nèi)存與計(jì)算空間。憑借 260TB/s 的 NVLink 聚合吞吐量，該系統(tǒng)消除了模型切分需求，使整個(gè)機(jī)架能夠作為統(tǒng)一協(xié)同的 AI 引擎運(yùn)行。

基于 DGX Rubin NVL8 系統(tǒng)構(gòu)建的 NVIDIA DGX SuperPOD，由 64 臺(tái) DGX Rubin NVL8 系統(tǒng)組成，搭載了 512 個(gè)Rubin GPU。NVIDIA DGX Rubin NVL8 系統(tǒng)采用液冷架構(gòu)，搭載 x86 CPU，為各類(lèi) AI 項(xiàng)目從開(kāi)發(fā)到部署全流程提供強(qiáng)勁支撐，助力企業(yè)邁入 Rubin 時(shí)代。每臺(tái) DGX Rubin NVL8 配備八塊 NVIDIA Rubin GPU 及第六代 NVLink 技術(shù)，其 NVFP4 浮點(diǎn)運(yùn)算能力較 NVIDIA Blackwell 系統(tǒng)提升 5.5 倍。

面向 AI 工廠的下一代網(wǎng)絡(luò)

Rubin 平臺(tái)通過(guò)革命性網(wǎng)絡(luò)架構(gòu)重新定義了數(shù)據(jù)中心，將其打造為高性能 AI 工廠。該平臺(tái)搭載NVIDIA Spectrum-6以太網(wǎng)交換機(jī)、NVIDIA Quantum-X800InfiniBand 交換機(jī)、BlueField-4DPU 及 ConnectX-9 SuperNIC，專(zhuān)為承載全球最龐大的 AI 工作負(fù)載而設(shè)計(jì)。通過(guò)將這些創(chuàng)新技術(shù)集成至 NVIDIA DGX SuperPOD，Rubin 平臺(tái)徹底消除了傳統(tǒng)架構(gòu)在擴(kuò)展性、擁塞及可靠性方面的瓶頸。

針對(duì)大規(guī)模集群優(yōu)化的連接性能

新一代 800Gb/s 端到端網(wǎng)絡(luò)套件為 AI 基礎(chǔ)設(shè)施提供兩條專(zhuān)用路徑，無(wú)論采用 InfiniBand 還是以太網(wǎng)均能確保峰值效率：

NVIDIA Quantum-X800 InfiniBand：為專(zhuān)用 AI 集群提供業(yè)界最低延遲與最高性能。采用 SHARP v4 (Scalable Hierarchical Aggregation and Reduction Protocol) 及自適應(yīng)路由技術(shù)，將集合通信操作卸載到網(wǎng)絡(luò)。

NVIDIA Spectrum-X 以太網(wǎng)：基于 Spectrum-6 以太網(wǎng)交換機(jī)和 ConnectX-9 SuperNIC 構(gòu)成，該平臺(tái)采用標(biāo)準(zhǔn)以太網(wǎng)協(xié)議，為 AI 工廠提供可預(yù)測(cè)的高性能橫向 (scale-out) 擴(kuò)展與跨區(qū)域 (scale-across) 連接，并針對(duì) AI 工作負(fù)載的“東西向”流量模式進(jìn)行專(zhuān)項(xiàng)優(yōu)化。

打造十億瓦級(jí) AI 工廠

這些創(chuàng)新代表了 Rubin 平臺(tái)的極致協(xié)同設(shè)計(jì)。憑借對(duì)擁塞控制與性能隔離技術(shù)的掌控，NVIDIA 正為下一波十億瓦級(jí) AI 工廠鋪平道路。這種整體化方案確保了當(dāng) AI 模型日益復(fù)雜時(shí)，AI 工廠的網(wǎng)絡(luò)架構(gòu)仍能成為速度的催化劑而非瓶頸。

NVIDIA 軟件推動(dòng) AI 工廠運(yùn)營(yíng)與部署

NVIDIA Mission Control——專(zhuān)為基于 NVIDIA Blackwell 架構(gòu)的 DGX 系統(tǒng)設(shè)計(jì)的 AI 數(shù)據(jù)中心運(yùn)維與編排軟件——現(xiàn)已支持基于 Rubin 架構(gòu)的 NVIDIA DGX 系統(tǒng)，助力企業(yè)實(shí)現(xiàn)基礎(chǔ)設(shè)施管理的自動(dòng)化與運(yùn)維自動(dòng)化。

NVIDIA Mission Control 可在多方面加速基礎(chǔ)設(shè)施運(yùn)營(yíng)，涵蓋配置部署、設(shè)施集成、集群管理及工作負(fù)載調(diào)度。

借助智能集成軟件，企業(yè)可更精準(zhǔn)地掌控 NVIDIA Rubin 的冷卻與供電事項(xiàng)，同時(shí)提升基礎(chǔ)設(shè)施彈性。該平臺(tái)通過(guò)快速泄漏檢測(cè)實(shí)現(xiàn)更迅捷的響應(yīng)，解鎖 NVIDIA 最新能效創(chuàng)新技術(shù)，并憑借自主恢復(fù)功能最大化 AI 工廠的生產(chǎn)力。

NVIDIA DGX 系統(tǒng)還支持NVIDIA AI Enterprise軟件平臺(tái)，包括NVIDIA NIM，例如用于 NVIDIA Nemotron-3 系列開(kāi)放模型、數(shù)據(jù)和庫(kù)。

DGX SuperPOD：工業(yè) AI 的未來(lái)之路

DGX SuperPOD 長(zhǎng)期以來(lái)一直是大型 AI 基礎(chǔ)設(shè)施的藍(lán)圖。Rubin 平臺(tái)的問(wèn)世將成為新一代 AI 工廠的起點(diǎn)——這些系統(tǒng)旨在實(shí)現(xiàn)跨數(shù)千步推理，并以顯著降低的成本交付智能，助力企業(yè)構(gòu)建下一代尖端模型、多模態(tài)系統(tǒng)和代理式 AI 應(yīng)用。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴