国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA MGX變革AI工廠設計與部署

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2025-06-06 15:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

生成式 AI、大語言模型和高性能計算呈指數級增長,這對數據中心基礎設施提出了前所未有的要求。傳統服務器架構難以滿足現代加速計算在功率密度、散熱需求和快速迭代周期方面的要求。

本文介紹了NVIDIA MGX的優勢,這是一種用于加速計算的模塊化參考架構,它正在重新定義企業和云服務提供商構建可擴展 AI 工廠的方式。

為何模塊化架構如今至關重要?

借助 NVIDIA MGX,合作伙伴可以像搭積木那樣設計多種系統,從而節省開發成本并縮短產品上市時間。NVIDIA MGX 支持多代產品以及數百種 GPU、DPU、CPU、存儲和網絡的組合方案,適用于 AI、HPC 和數字孿生等領域。

當前推動 NVIDIA MGX 廣泛應用的三大趨勢包括:

功率密度與散熱:現代 AI 計算的高要求促使功率密度不斷提高,并推動液冷基礎設施越來越普及。例如,NVIDIA Blackwell GPU 需要單機架功率最高可達 120 千瓦的全機架級解決方案,來滿足由此產生的多項技術要求。MGX 通過液冷匯流排和歧管來滿足這些需求,即使在 1400A 的負載下仍能將冷卻液溫差控制在 15°C 以內,從而能夠在不影響性能或可靠性的情況下實現高密度的機架級部署。

異構工作負載支持:企業需要在同一數據中心內管理日益多樣化的工作負載,包括使用 72-GPU NVIDIA GB200 NVL72 集群的 AI 后訓練、需要測試時擴展的推理任務以及數字孿生模擬。MGX 的模塊化混搭兼容性使企業能夠針對特定工作負載定制基礎設施,而且無需重新設計整個機架。

供應鏈敏捷性:MGX 支持在工廠內預集成約 80% 的組件,包括匯流排、冷板和電源線束。這簡化了構建過程,使 ODM 廠商能夠將部署周期從 12 個月縮短到 90 天以內。

基于這些趨勢,像 MGX 這樣標準化且穩定的架構能夠確保可靠、兼容的服務器部署,使之在不犧牲互操作性的前提下,滿足不斷發展的性能需求。這種穩定性對企業實現基礎設施投資的前瞻性布局至關重要,同時還保留了適應新興工作負載和技術的靈活性。

龐大的 MGX 生態系統讓企業可以靈活地選購多樣化的組件并避免供應商鎖定,這能夠最大限度地降低投資風險、縮短交貨時間并減少不確定性。由于合作伙伴能夠自由地在廣泛的認證組件中進行選擇,MGX 使組織在優化其數據中心構建時能夠降低成本、提高性能和供應鏈彈性。

基于標準的模塊化 MGX 設計簡化了集成過程,消除了對定制解決方案的需求,從而實現了快速、成本可控的部署和更具靈活性的擴展。這種方法不僅加快了上市時間,還簡化了后續維護和升級,使企業能夠根據需求增長和技術發展情況高效地擴展 AI 工廠。

MGX 機架系統內部構造

NVIDIA MGX 機架系統圍繞兩大核心模塊構建:計算托盤和 NVLink 交換機托盤。每個計算托盤都配備了強大的 CPU 和 GPU 組合,例如 NVIDIA Grace CPU 與 NVIDIA Blackwell GPU 的搭配。它們為 AI 訓練、推理和模擬工作負載提供核心加速計算性能。NVLink 交換機托盤則提供高速、低延遲的互連結構,將這些計算托盤連接在一起,實現 GPU 到 GPU 的無縫通信和整個機架的高效擴展。

然而,完整的 MGX 機架系統還遠不止計算和交換機托盤。為了滿足現代 AI 工廠對規模和效率的運行要求,該系統還依賴強大的機械電氣和管道(冷卻)基礎設施,包括:

機械組件:模塊化 MGX 機架本身為高密度數據中心部署提供了所需的結構完整性和可維護性。電源架支架將電源架固定在機架內,而滑軌則便于機架式設備的安裝和維護。

電氣組件:在電力輸送與連接方面,MGX 54V 匯流排和 MGX 1400A 匯流排在整個機架內高效地分配電力,支持 HPC 負載。33 kW 電源架為系統提供充足的電力,而 MGX 電源線束可以靈活地連接電源架和匯流排。MGX 高速電纜保障高速數據傳輸,確保計算托盤和交換機托盤之間保持最優的通信。

管道或冷卻組件:MGX 冷板為 GPU 提供高效液冷,維持其最佳運行溫度。MGX 44RU 歧管用于管理機架內的冷卻液分配。MGX NVQD(NVIDIA 快換接頭)和 MGX UQD(通用快換接頭)等快換接頭實現液冷管線的快速安全連接,簡化維護并最大限度地減少停機時間。

這種模塊化方法可以顯著節省時間,因為標準組件可以在工廠預安裝,并通過即插即用的電源和冷卻裝置在現場集成。

NVIDIA GB200 NVL72 和 GB300 NVL72 系統中的 MGX 組件是基礎架構,用于管理功率密度和熱負載,使這些液冷機架級平臺能夠提供前所未有的 AI 性能。通過將先進的液冷 MGX 架構集成到 Blackwell 計算節點中,NVIDIA 滿足了 GB200 NVL72 的單機架 120 千瓦的能耗需求,而 GB300 NVL72 的 72 個 Blackwell Ultra GPU 則需要更高的散熱協調能力,以實現其高達 50 倍的 AI 推理輸出提升。

這種設計理念需要機械工程團隊(優化冷卻液分配)、電源專家(高效電壓調節)與制造合作伙伴(實現前端可維護性)之間的緊密協作。所有這些都通過 NVIDIA 的芯片級 NVLink 互連技術統一起來,該技術將 36 個 Grace CPU 和 72-144 個 GPU 綁定到一個統一的計算域中。這種聯合設計的解決方案比前代 NVIDIA Hopper 集群的能效提升了 25 倍,展現了 MGX 的系統集成如何將原始算力轉化為可擴展的 AI 基礎設施。

變革 AI 工廠的設計與部署

NVIDIA MGX 為整個數據中心生態系統帶來了切實的好處。

對于系統制造商來說,通過共享參考設計,MGX 使每個平臺的研發成本降低了 200 萬至 400 萬美元,并使團隊能夠一次性認證整個 NVIDIA 軟件棧,其中包括 NVIDIA CUDA-X、NVIDIA AI Enterprise 和 NVIDIA Omniverse。

對于數據中心運營商來說,能夠使用一致的電源和冷卻接口,實現從 8-GPU 節點無縫擴展到 144-GPU 機架,同時由于電源效率高達 94% 且冷卻管道系統可重復使用,總體擁有成本降低了 50%。

對于 AI 工作負載來說,MGX 使各組織能夠利用 NVLink 交換機在 72-GPU 的統一的計算域上訓練參數量高達 1.8 萬億的模型,并在 72 節點機架上部署延遲波動小于 5 毫秒的推理集群。

開始使用

NVIDIA MGX 不僅僅是一項機架標準,更是 AI 工廠時代的基礎。隨著 200 多家生態系統合作伙伴已采用 MGX 組件,企業由此獲得了通往未來 exascale 級 AI 的路徑。隨著 NVIDIA Blackwell、NVIDIA Rubin 等不斷突破計算邊界,MGX 模塊化架構確保了 AI 工廠能夠隨著芯片創新的不斷發展,并通過模塊化升級路徑來保護數據中心投資。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109731
  • 交換機
    +關注

    關注

    23

    文章

    2904

    瀏覽量

    104468
  • 數據中心
    +關注

    關注

    18

    文章

    5651

    瀏覽量

    75017
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301404

原文標題:NVIDIA MGX 為 AI 工廠奠定堅實的模塊化基礎

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA Spectrum-X以太網硅光技術助力AI工廠網絡創新

    NVIDIA 將率先為 AI 工廠引入采用光電一體封裝 (CPO) 的優化以太網網絡,通過 NVIDIA Spectrum-X 以太網硅光技術,為
    的頭像 發表于 01-14 09:06 ?609次閱讀
    <b class='flag-5'>NVIDIA</b> Spectrum-X以太網硅光技術助力<b class='flag-5'>AI</b><b class='flag-5'>工廠</b>網絡創新

    NVIDIA Omniverse基于Container的部署推流方案

    為了讓客戶能夠高效安裝和部署 NVIDIA Omniverse 及 NVIDIA Isaac 平臺,NVIDIA 現已推出簡單便捷的容器化部署
    的頭像 發表于 12-17 10:17 ?672次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse基于Container的<b class='flag-5'>部署</b>推流方案

    NVIDIA擴大與微軟合作推動AI超級工廠建設

    在 Microsoft Ignite 大會上,NVIDIA 擴大與微軟的合作,包括在由 NVIDIA Blackwell 平臺驅動的全新 Microsoft Fairwater AI 超級工廠
    的頭像 發表于 12-01 09:52 ?796次閱讀

    NVIDIA CEO黃仁勛暢談AI時代最新藍圖

    在主題演講中,NVIDIA 創始人兼首席執行官黃仁勛勾勒出了 AI 時代的最新藍圖。從大規模 GPU 部署和量子技術突破,到 AI 工廠、機
    的頭像 發表于 11-03 14:45 ?769次閱讀

    三星攜手NVIDIA 以全新AI工廠引領全球智能制造轉型

    AI驅動制造技術,推動半導體、移動設備與機器人產業的企業級數字化轉型 部署50,000顆NVIDIA GPU并結合NVIDIA Omniverse,構建下一代
    的頭像 發表于 11-03 13:41 ?1773次閱讀

    NVIDIA IGX Thor 機器人處理器將實時物理 AI 引入工業和醫療邊緣場景

    年 10 月 28 日—— ?AI 正由數字世界走向物理世界。在工廠車間和手術室等場景中,機器正逐步進化為能夠實時觀察、感知并作出決策的協作伙伴。 ? 為加速這一變革NVIDIA
    的頭像 發表于 10-29 10:31 ?1213次閱讀
    <b class='flag-5'>NVIDIA</b> IGX Thor 機器人處理器將實時物理 <b class='flag-5'>AI</b> 引入工業和醫療邊緣場景

    OpenAI和NVIDIA宣布達成合作,部署10吉瓦NVIDIA系統

    此次合作將助力 OpenAI 構建和部署至少 10 吉瓦(gigawatt)的 AI 數據中心,這些數據中心將采用 NVIDIA 系統,包含數百萬塊 NVIDIA GPU,為 Open
    的頭像 發表于 09-23 14:37 ?1419次閱讀
    OpenAI和<b class='flag-5'>NVIDIA</b>宣布達成合作,<b class='flag-5'>部署</b>10吉瓦<b class='flag-5'>NVIDIA</b>系統

    Cadence 借助 NVIDIA DGX SuperPOD 模型擴展數字孿生平臺庫,加速 AI 數據中心部署與運營

    人員將能夠在 AI 工廠的構建中輕松部署世界領先的 AI 加速器。作為一款創新解決方案,Cadence Reality Digital Twin Platform 能夠在物理實施之前,
    的頭像 發表于 09-15 15:19 ?1508次閱讀

    NVIDIA硅光技術助力邁向百萬GPU AI工廠

    在全球范圍內,AI 工廠正在崛起 —— 大量的這些新型數據中心并非為提供網頁或電子郵件服務而建,而是用于訓練和部署智能本身。互聯網巨頭們已經為其客戶在 AI 云基礎設施上投資了數十億美
    的頭像 發表于 08-27 12:34 ?1211次閱讀

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 開源其物理 AI 平臺 NVIDIA Cosmos 中的關鍵模型——NVIDIA Cosmos Reason-1-7B。這款先進的多模態大模型能夠理解視頻、進行物理
    的頭像 發表于 07-09 10:17 ?814次閱讀

    NVIDIA計劃打造全球首個工業AI云平臺

    NVIDIA 宣布,其正在為歐洲制造商構建全球首個工業 AI 云。這家總部位于德國的 AI 工廠將配備 1 萬個 GPU,包括通過 NVIDIA
    的頭像 發表于 06-16 14:17 ?1431次閱讀

    NVIDIA攜手合作伙伴提升AI智能體的交互能力

    NVIDIA Enterprise AI Factory 的經驗證設計和全新的 NVIDIA AI Blueprint 可幫助企業部署具有溝
    的頭像 發表于 05-22 09:52 ?1064次閱讀

    NVIDIA擴展適用于AI工廠數字孿生的Omniverse Blueprint

    NVIDIA 宣布大幅擴展適用于 AI 工廠數字孿生的 Omniverse Blueprint,為工程團隊提供更多 AI 工廠構建工具,目前
    的頭像 發表于 05-22 09:48 ?1056次閱讀

    NVIDIA驅動的AI工廠正在重新定義數據中心

    NVIDIA 及其生態系統合作伙伴正在為 AI 推理時代構建大規模 AI 工廠,而每家企業都將需要一個這樣的工廠
    的頭像 發表于 04-11 11:27 ?1008次閱讀
    <b class='flag-5'>NVIDIA</b>驅動的<b class='flag-5'>AI</b><b class='flag-5'>工廠</b>正在重新定義數據中心

    英偉達GTC2025亮點:NVIDIA認證計劃擴展至企業存儲領域,加速AI工廠部署

    ,現在已將企業存儲納入其中,旨在通過加速計算、網絡、軟件和存儲,助力企業更高效地部署 AI 工廠。 在企業構建 AI 工廠的過程中,獲取高質
    的頭像 發表于 03-21 19:38 ?2057次閱讀