国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

華為發布新一代超節點產品,支持8192張NPU卡高速互聯

Carol Li ? 來源:電子發燒友網 ? 作者:李彎彎 ? 2026-03-09 09:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群



電子發燒友網報道(文/李彎彎)近日,在世界移動通信大會(MWC26)期間,華為計算產品線總裁張熙偉首次在海外發布多款超節點產品及解決方案,包括Atlas 950 SuperPoD智算超節點、Atlas 850E超節點服務器,以及業界首款通用計算超節點TaiShan 950 SuperPoD,還有TaiShan 500、TaiShan 200等系列化產品。

超節點技術:AI算力發展的關鍵支撐

人工智能快速發展的當下,每月都有新突破。智能體時代,模型從局限于大語言模型走向全模態原生融合,萬億級模型參數和10萬億級數據訓練成為常態,算力需求提升十倍到百倍。同時,模型上下文序列長度顯著增加,對內存容量和帶寬需求大幅提升。

而且,隨著AI在行業應用中的深入,實時性挑戰愈發凸顯,如金融風控場景時延要求小于20毫秒,反欺詐場景時延要在10毫秒以下,傳統計算架構難以滿足低時延要求。單一芯片提升已無法滿足AI算力需求,多芯片互聯、擴大計算節點規模成為必然選擇。

超節點技術應運而生,它是面向AI大模型訓練與推理需求的技術方案。通過高速互聯協議與專用交換芯片,將數十至數百個GPU或AI計算芯片在單機柜或集群內緊密整合,形成邏輯上統一編址、高帶寬、低延遲的協同計算系統。其核心目標是突破傳統分布式計算中的“通信墻”瓶頸,提升大規模并行計算效率。該技術具備高算力密度、硬件解耦、開放兼容等特點,是構建標準化“AI工廠”、提升智算基礎設施效能的關鍵路徑。

目前,業內對超節點有不同層級劃分。一是在單機柜內部實現高速互聯,常稱為“SuperNode”;另一種是由跨機柜組成的集群級互聯,如英偉達提出的“SuperPod”。行業構建大規模GPU集群主要有兩種方式:Scale-Out(橫向擴展)和Scale-Up(縱向擴展)。Scale-Out是傳統方法,通過傳統網絡連接獨立服務器組成集群;Scale-Up則是增加單個節點內資源數量。超節點是Scale-Up的重要實現方式,其內部Scale-Up網絡時延目標為百納秒級,遠低于Scale-Out網絡的微秒級,能支撐TP(張量并行)、EP(專家并行)等高通信量任務。

Scale-Up網絡追求極致性能,具備高帶寬、低時延和大內存空間三大核心特性。高帶寬方面,提供Tbps級別互聯帶寬,如NVL72方案中單GPU提供7.2Tbps帶寬;低時延方面,目標時延為百納秒級,而Scale-Out網絡時延通常在10微秒級別;大內存空間方面,支持統一內存編址或內存語義,擴展有效內存容量。

AI訓練中,流水線并行(PP)和數據并行(DP)通信量相對較小,可通過Scale-Out網絡處理,但張量并行(TP)和專家并行(EP)通信量極大,必須依賴Scale-Up網絡解決。超節點通過構建高帶寬域(HBD),整合大量GPU,降低大規模集群全局組網復雜度與運維難度,提升資源利用效率。其核心應用場景是支撐訓練參數規模超萬億級別的AI大模型訓練與推理,滿足AI Agent等多模型協同實時交互場景的高頻、海量通信需求。

華為超節點產品與技術:創新引領算力升級

去年,華為發布業界規模最大的昇騰384超節點,將384顆昇騰AI芯片連接成集群,提供高達300PFLOPs的密集BF16算力,性能接近英偉達GB200 NVL72系統的兩倍。

在芯片互聯規模與Scale up網絡性能上,華為CloudMatrix 384優勢明顯。GB200 NVL72采用整機柜型超節點方案,有72個GPU芯片;而CloudMatrix 384采用分機柜超節點方案,計算節點和交換節點分裝不同機柜(12個計算柜和4個交換柜),Scale up計算單元由384個Ascend 910C芯片組成,昇騰芯片數量增加五倍,彌補了單個GPU性能不足。其BF16密集算力約300 PFLOPS,Scale up單向帶寬134400 GB/s,約是GB200 NVL72的2.1倍。

CloudMatrix 384的Scale up網絡采用兩層扁平拓撲架構,通過華為自研的靈衢網絡和靈衢總線設備互聯組網。靈衢網絡L1層由超節點交換網板承載,L2層由總線設備柜中的靈衢總線設備組成,L1 - L2通過光纖組成超節點集群。L1層每個計算節點集成8個昇騰910C NPU、4個鯤鵬CPU,內部有7顆板載UB交換芯片;L2層劃分為7個獨立子平面,每個子平面含16個L2 UB交換芯片,L1交換芯片扇出16條鏈路到對應L2子平面交換芯片,實現無阻塞全對等拓撲。該超節點通過3168根光纖和6912個400G LPO模塊構建高速互連總線,在UB平面、RDMA平面等方面有詳細設計。

“靈衢”是華為2025年全聯接大會發布的互聯技術,是一種面向超節點的互聯協議,將IO、內存訪問和處理單元間通信統一在同一體系,實現高性能數據搬移、資源統一管理等。其協議棧全面完整,基于靈衢的計算系統部署范圍廣,處理單元地位平等、資源可池化,還支持多種機制提升性能、增進容錯性等。

此外,華為發布的Atlas 950 SuperPoD智算超節點,以單柜64卡為基本單元,最大支持8192張NPU卡高速互聯,在算力規模、互聯帶寬等指標上領先英偉達,大模型訓練效率、可靠性與推理性能大幅提升。Atlas 850E超節點服務器適配現有風冷機房,支持8到1024卡靈活擴展和快速部署。

軟件生態方面,華為持續貢獻openEuler開源操作系統,全面開源開放CANN異構計算架構,通過分層解耦,將算子庫、加速庫、圖計算、編程語言等軟件代碼全量開源。北向支持PyTorch、vLLM、SGLang等業界開源社區和項目,大幅提升開發者易用性。華為副董事長、輪值董事長徐直軍曾表示,盡管受美國制裁,不能產出最先進工藝制程的芯片,但基于聯接技術能力,華為能做到萬卡級超節點,實現世界最強算力。

總結:

華為此次發布的新一代超節點產品,在性能和規模上實現重大突破,為全球AI發展提供了強大算力支持。超節點技術作為AI算力發展的關鍵支撐,通過創新架構設計,有效解決了傳統計算中的瓶頸問題,滿足了AI大模型訓練和推理的嚴苛需求。華為在超節點技術領域的探索和創新,不僅體現在硬件產品的性能提升上,更在于自研協議和軟件生態的全面布局。靈衢協議的推出和CANN異構計算架構的開源開放,為開發者提供了更加便捷、高效的開發環境,促進了AI技術的創新和應用。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 華為
    +關注

    關注

    218

    文章

    36009

    瀏覽量

    262136
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    華為發布新一代綠色AI站點和GW級AIDC解決方案

    在MWC26巴塞羅那期間舉辦的產品與解決方案發布會上,華為數字能源副總裁何波發布新一代AI綠色站點和GW級AIDC解決方案,在智能體
    的頭像 發表于 03-05 10:54 ?295次閱讀

    中科曙光3套scaleX萬集群落地國家互聯網鄭州核心節點

    2月5日,由中科曙光提供的3套萬集群系統在國家互聯網鄭州核心節點同時上線試運行,成為全國首個實現3萬
    的頭像 發表于 02-09 10:32 ?487次閱讀

    福田汽車發布新一代產品Wonder Plus

    在11月9日舉行的福田汽車2026全球合作伙伴大會上,福田汽車正式面向全球市場發布了全新一代產品——Wonder Plus。面對全球不同末端配送市場的升級需求,以“
    的頭像 發表于 11-18 09:39 ?580次閱讀

    昆侖芯節點亮相,單卡性能提升95%

    ;天池512節點將于?2026下半年上市,最高支持512互聯
    的頭像 發表于 11-16 07:32 ?1w次閱讀
    昆侖芯<b class='flag-5'>超</b><b class='flag-5'>節點</b>亮相,單卡性能提升95%

    640節點問世:國產算力實現關鍵

    單機柜級640節點ScaleX640,為如火如荼的算力競爭注入了新的變量。 ? 這款被命名為ScaleX640的節點,憑借“
    的頭像 發表于 11-11 09:26 ?2295次閱讀

    蘭山國投攜手華為重磅發布瑯琊充興程重充電站

    解決方案打造的瑯琊充興程重充電站也正式發布。該充電站是全電物流加速的重要里程碑,也是蘭山國投攜手華為構建臨沂物流重
    的頭像 發表于 11-10 14:21 ?645次閱讀

    華為發布全球最強算力節點和集群

    華為全聯接大會2025(HUAWEI CONNECT 2025)上,華為發布最強算力節點和集群,并表示將發展生態作為公司核心戰略,提升到
    的頭像 發表于 10-10 17:29 ?2246次閱讀

    【內測活動同步開啟】這么小?這么強?新一代大模型MCP開發板來啦!

    【內測活動同步開啟】這么小?這么強?新一代大模型MCP開發板來啦! 聆思全新一代六合芯片「LS26系列」,搭載WIFI / BLE & BT / NPU,與「小聆AI」強強
    發表于 09-25 11:47

    華為節點互聯技術引領AI基礎設施新范式

    今日,華為全聯接大會2025在上海啟幕,華為副董事長、輪值董事長徐直軍發表題為“以開創的節點互聯技術,引領AI基礎設施新范式”的主題演講,
    的頭像 發表于 09-20 16:15 ?2138次閱讀

    面向萬億級參數大模型,“節點”涌現

    UniPoD系列節點產品,旨在為萬億級參數大模型的訓練與推理提供更強勁、更智能且更綠色的算力支持。 ? H3C UniPoD系列
    的頭像 發表于 08-03 02:37 ?8915次閱讀
    面向萬億級參數大模型,“<b class='flag-5'>超</b><b class='flag-5'>節點</b>”涌現

    重磅!華為昇騰384節點真機登場,中興攜廠商首秀GPU節點實力

    作為中國自主的算力核彈,華為昇騰384節點真機首次亮相。中興通訊、上海儀電、曦智科技、壁仞科技聯合打造的光互聯芯片及
    的頭像 發表于 07-29 00:45 ?1.2w次閱讀
    重磅!<b class='flag-5'>華為</b>昇騰384<b class='flag-5'>超</b><b class='flag-5'>節點</b>真機登場,中興攜廠商首秀GPU<b class='flag-5'>超</b><b class='flag-5'>節點</b>實力

    華為開發者大會2025(HDC 2025)亮點:華為發布盤古大模型5.5 宣布新一代昇騰AI云服務上線

    HarmonyOS、昇騰AI云服務、盤古大模型等最新科技創新成果。 在主題演講中,華為常務董事、華為云計算CEO張平安宣布基于CloudMatrix384 節點
    的頭像 發表于 06-20 20:19 ?4478次閱讀
    <b class='flag-5'>華為</b>開發者大會2025(HDC 2025)亮點:<b class='flag-5'>華為</b>云<b class='flag-5'>發布</b>盤古大模型5.5 宣布<b class='flag-5'>新一代</b>昇騰AI云服務上線

    華為云黃瑾:昇騰云CloudMatrix 384節點六大科技創新,定義下一代AI基礎設施

    難以支撐 AI 技術的代際躍遷,節點架構的誕生不僅是技術的突破,更是以工程化創新開辟 AI 產業的新路徑。華為云 CloudMatrix 384
    的頭像 發表于 05-17 10:31 ?4633次閱讀

    華為兆瓦充重磅產品全新發布

    近日,上海車展同期,華為智能充電網絡正式發布華為兆瓦充等重磅新品,從乘用車的“公里*”到
    的頭像 發表于 04-25 16:54 ?1356次閱讀

    寶馬發布新一代智能電子電氣架構

    高速數據傳輸,為車輛帶來數字化神經系統 慕尼黑2025年3月13日?/美通社/ --?寶馬發布新一代智能電子電氣架構,該架構是全球首個覆蓋全動力系統和全細分車型的架構,該架構更智能、更強大、更高效。全新電子電氣架構
    的頭像 發表于 03-13 15:42 ?747次閱讀