電子發燒友網綜合報道 在最近的Hot Chip2025大會上,華為進行了一場線上分享,提出了一種全新的AI數據中心網絡架構UB-Mesh。
隨著大語言模型(LLM)規模持續擴張,其訓練對計算算力與網絡帶寬的需求呈指數級增長。傳統數據中心多采用 Clos 架構,雖能提供對稱節點帶寬,卻因依賴大量高基數交換機與光模塊,存在成本高昂、可用性低等問題,難以滿足 LLM 訓練的大規模、高帶寬、低成本、高可用四大核心需求(R1-R4)。
那么UB-Mesh是通過分層本地化 nD-FullMesh 拓撲與多維度優化,實現性能、成本與可用性的平衡。
UB-Mesh 的設計遵循三大核心原則:一是流量驅動拓撲(P1),利用 LLM 訓練中張量并行(TP)、序列并行(SP)占 97% 流量且集中于近距離節點的特性,構建分層網絡;二是拓撲感知計算通信(P2),將并行策略、路由等與拓撲深度協同,避免帶寬浪費;三是自愈容錯(P3),通過硬件備份與快速故障恢復,保障訓練連續性。

UB-Mesh的整體架構設計,展示了從2D-FullMesh(機柜內)到4D-FullMesh(Pod內)再到SuperPod的擴展方式。
在核心架構設計上,UB-Mesh 以nD-FullMesh 拓撲為基礎,通過 “維度遞推” 實現規模化擴展:從板級 1D 全連接(相鄰 NPU 直接互連),到機架級 2D 全連接(1D mesh 間互連),最終形成 Pod 級 4D-FullMesh(UB-Mesh-Pod),可支持 8K NPU 的高帶寬域。UB-Mesh-Pod是一個由1024個NPU組成的4D-FullMesh集群。該集群內部,每個機柜包含64個NPU,構成一個2D-FullMesh;16個這樣的機柜再構成一個2D-FullMesh,從而形成一個4D-FullMesh的Pod。
該拓撲以短距離電連接為主(占比 86.7%),大幅減少對高成本光模塊與交換機的依賴,同時通過靈活帶寬分配,為近距離通信(TP/SP)提供高帶寬,遠距離通信(數據并行 DP)分配低帶寬,精準匹配 LLM 流量特征。
硬件層面,UB-Mesh 通過統一總線(UB) 實現組件互連,替代傳統混合互連(PCIe/NVLink/IB),支持 Load/Store 等同步操作與 Read/Write 等異步操作,不僅簡化驅動設計,還實現 IO 資源靈活分配與硬件資源池化(如 CPU、NPU、DDR 共享)。核心硬件包括支持 72 路 UB 通道的 NPU、32 路 UB 通道的 CPU,以及低基數交換機(LRS,用于機架內聚合)、高基數交換機(HRS,用于 Pod 間互連)。此外,架構采用 “64+1 備份設計”,每機架額外配置 1 個備用 NPU,節點故障時可通過 LRS 快速切換,僅增加少量延遲而不中斷訓練。
為解決架構落地挑戰,UB-Mesh 提出多維度優化機制。路由方面,創新全路徑路由(APR) ,結合源路由(8 字節緊湊頭實現路徑指示)、結構化尋址(按 Pod / 機架劃分地址段,減少路由表開銷)與拓撲感知無死鎖流控(TFC 算法,僅用 2 個虛擬通道實現無死鎖),充分利用多路徑帶寬,避免擁塞。故障恢復方面,采用 “直接通知” 機制,節點故障時直接向通信目標節點發送信息,相比傳統逐跳通知,大幅縮短收斂時間。通信優化方面,針對 All-Reduce 設計多環算法,通過 idle 鏈路復用與流量分區提升帶寬利用率;針對 All-to-All 采用多路徑傳輸與分層廣播 / 歸約,適配 MoE 模型的專家并行需求。
實驗驗證顯示,UB-Mesh 相比傳統 Clos 架構優勢顯著:成本效率提升 2.04 倍,減少 98% 高基數交換機與 93% 光模塊使用,網絡基礎設施成本占比從 67% 降至 20%;可用性達 98.8%,較 Clos(91.6%)提升 7.2%,其 Mean Time Between Failure(MTBF)達 98.5 小時,是 Clos 的 7.14 倍;在 LLAMA-70B、GPT3-175B、MoE-10T 等模型訓練中,性能僅下降 7% 以內,且集群規模擴展至 64 倍時,線性度仍保持 95% 以上,可支持超大規模 LLM 訓練。
UB-Mesh架構通過其創新的nD-FullMesh拓撲、統一總線技術以及一系列系統級優化,成功地解決了大規模LLM訓練所面臨的“通信墻”問題。它不僅在理論上證明了分層局部化網絡設計的優越性,更在實踐中展示了其在成本、性能和可靠性方面的巨大優勢。UB-Mesh為構建下一代超大規模、高性價比的AI計算集群提供了一個強有力的范例,預示著AI基礎設施設計的一次重要范式轉移。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
發布評論請先 登錄
相關推薦
熱點推薦
華為亮相2025亞洲數據中心展覽會
在亞太地區規模最大的數據中心行業盛會——新加坡科技周「2025亞洲數據中心展覽會」上,華為數字能源于新加坡濱海灣金沙會展中心的參展活動圓滿收官。為期兩天的展會中,
華為面向拉美地區發布全新星河AI數據中心網絡方案
在華為數據通信創新峰會2025拉美站期間,以“星河AI數據中心網絡,賦AI時代新動能”為主題的分論壇上,華為面向拉美地區
華為數據中心古井貢酒樣板點重磅發布
以“安全可靠,醞建未來”為主題的華為數據中心古井貢酒樣板點發布會在亳州成功舉行。該樣板點使用華為智能微模塊和UPS5000-H解決方案,助力古井貢酒構建安全、高效、智能的現代化
華為數據中心自動駕駛網絡通過EANTC歐洲高級網絡測試中心L4級自智網絡測評
Networking Test Center,簡稱“EANTC”)發布華為數據中心自動駕駛網絡的自智網絡(Autonomous Netwo
華為面向亞太地區發布全新星河AI數據中心網絡方案
在華為數據通信創新峰會2025亞太站期間,以“星河AI數據中心網絡,賦AI時代新動能”為主題的分論壇上,華為面向亞太地區
華為面向中東中亞地區發布全新星河AI數據中心網絡
近日,在華為數據通信創新峰會2025中東中亞站期間,以“星河AI數據中心網絡,賦AI時代新動能”為主題的分論壇上,華為面向中東中亞地區
華為榮獲數據中心自智網絡基礎能力解決方案檢測證書
2025年云網智聯大會首日,中國信息通信研究院(簡稱“信通院”)向華為技術有限公司(以下簡稱“華為”)等首批獲得《數據中心自智網絡基礎能力解決方案檢測證書》的企業正式頒發證書。此項認證
適用于數據中心和AI時代的800G網絡
和性能隔離能力,以保障不同用戶任務互不干擾。
分布式AI計算與網絡架構設計
分布式計算已成為AI訓練的主流方式,通過將工作負載分配到多個GPU節點并行處理,以加速模型訓練。這對數據中心
發表于 03-25 17:35
華為攜手中控技術打造全國數據中心網絡創新示范項目
華為中國合作伙伴大會2025期間,華為與中控技術股份有限公司(以下簡稱“中控技術”)聯合發布星河AI數據中心網絡優秀實踐樣板點。此次合作旨在
華為全新升級星河AI數據中心網絡
在華為中國合作伙伴大會2025期間,以 “星河AI數據中心網絡,賦AI時代新動能”為主題的數據中心網絡分論壇圓滿落幕。本次論壇匯聚了來自全國
優化800G數據中心:高速線纜、有源光纜和光纖跳線解決方案
高速線纜支持熱插拔功能,具有低功耗和小彎曲半徑,便于靈活布線,可實現高穩定性、低成本、節省空間和高散熱等優勢,非常適合數據中心布線需求。這些高速線纜能夠與交換機、路由器和服務器無縫集成,確保網絡
發表于 03-24 14:20
華為攜手EANTC啟動數據中心網絡ADN分級測評認證
近日,華為聯合EANTC(THE EUROPEAN ADVANCED NETWORKING TEST CENTER)正式啟動數據中心網絡ADN分級測評認證。
華為發布新一代站點能源架構及AI數據中心建設理念
西班牙巴塞羅那2025年3月13日?/美通社/ -- 在MWC25巴塞羅那期間舉辦的產品與解決方案發布會上,華為數據中心能源及關鍵供電產品線總裁何波發布新一代站點能源
華為發布新一代站點能源架構及AI數據中心建設原則
在MWC25巴塞羅那期間舉辦的產品與解決方案發布會上,華為數據中心能源及關鍵供電產品線總裁何波發布新一代站點能源架構“Single Site
華為發布數據中心新型網絡架構UB-Mesh
評論