電子發燒友網綜合報道 近日,在光合組織2025人工智能創新大會(HAIC 2025)上,中科曙光正式發布并展出了全球領先的ScaleX萬卡超集群。這一國產萬卡級AI集群系統首次以真機形式亮相,標志著中國在高性能計算領域的又一次重大突破。
中科曙光高級副總裁李斌表示,面對人工智能基礎設施對性能、效率、可靠性、可擴展性等方面的極致需求,ScaleX萬卡超集群在超節點架構、高速互連網絡、存儲性能優化、系統管理調度等方面實現了多項創新突破,部分技術與能力已超越海外同類產品研發路線圖的2027年NVL576里程節點。
從核心參數來看,該超節點(Super Pod)包含576顆Rubin Ultra GPU(代號“Kyber”),設計目標為實現15 EFLOPS(FP4推理)與5 EFLOPS(FP8訓練)算力,將是GB 300 NVL72(Blackwell架構代表性產品)的14倍。
公開報道顯示,作為系統計算核心,Rubin Ultra GPU由兩塊掩模尺寸的GPU組成,擁有288GB HBM4內存,FP4峰值推理能力可達50 PFLOPS,預計2026年下半年上市。得益于這一強勁性能,NVL576可單機柜完成萬億參數模型(如GPT-4級別)訓練,且訓練周期較此前大幅縮短,預計將從數月縮減為數周。
優勢1:全球首創單機柜級640卡超節點。ScaleX萬卡超集群由16個曙光ScaleX 640超節點通過ScaleFabric高速網絡互連而成,可實現10240塊AI加速卡部署,總算力規模超5 EFLOPS。作為全球首個單機柜級640卡超節點,ScaleX 640采用超高密度刀片、浸沒相變液冷等技術,將單機柜算力密度提升20倍,PUE值低至1.04。
優勢2:自主研發原生RDMA高速網絡。曙光ScaleFabric網絡基于國內首款400G類InfiniBand的原生RDMA網卡與交換芯片,可實現400Gb/s超高帶寬、低于1微秒端側通信延遲,超節點間通信性能達到業內領先水平,能充分釋放萬卡超集群算力,且可將超集群規模輕松擴展至10萬卡以上。相較于傳統IB網絡,其性能提升2.33倍,同時網絡總體成本降低30%。
優勢3:存、算、傳緊耦合深度優化。通過“超級隧道”、AI數據加速等設計,實現從芯片級、系統級到應用級的三級數據傳輸協同優化,使存力平臺高效應對大模型訓練時萬卡并發讀寫帶寬的極致需求,提升高通量AI推理的響應速度與結果精準度,并可將AI加速卡資源利用率提高55%。
優勢4:超集群數字孿生與智能調度。通過物理集群數字孿生,實現故障定位、修復等全流程可視化智能管理;智能化運維平臺可支撐集群長期可用性達99.99%;智能調度引擎可管理萬級節點、服務十萬級用戶,支持每秒萬級作業調度。
除技術突破外,ScaleX萬卡超集群的發布更標志著國產AI算力生態從“單點突圍”邁向“生態共進”的關鍵轉折。2025年9月,中科曙光已協同20多家AI產業鏈企業推出“AI計算開放架構”,通過共享關鍵共性技術,推進智算集群的協同創新。
在中科曙光看來,相較于技術、產品、解決方案層面的突破,整個智算生態系統的構建更為重要。縱觀歷史上關鍵技術的普及軌跡,主要有兩條可選路徑:一是依靠少數巨頭打造的封閉式全棧垂直體系,二是基于開放架構、由產業鏈各環節共同參與的協作生態。兩者并非非此即彼的替代關系,但前者往往占據強勢地位,后者要贏得發展空間必須付出巨大努力。
對國內智算產業而言,當前面臨的挑戰紛繁復雜,亟需整合產業鏈上的大量企業,實現真正的跨層協作優化,進而打造開放式、標準化、高效率的集群算力,才能在日趨白熱化的競爭中掌握主動權。不過,這條道路充滿荊棘,橫亙在前方的技術墻與生態墻極難跨越,市場呼喚開路先鋒的引領與垂范。
中科曙光高級副總裁李斌表示,面對人工智能基礎設施對性能、效率、可靠性、可擴展性等方面的極致需求,ScaleX萬卡超集群在超節點架構、高速互連網絡、存儲性能優化、系統管理調度等方面實現了多項創新突破,部分技術與能力已超越海外同類產品研發路線圖的2027年NVL576里程節點。
NVL576:下一個算力里程節點
NVL576是英偉達基于下一代Rubin Ultra架構打造的機柜級AI超算系統,預計2027年下半年正式亮相,定位“AI工廠”核心心臟,主要面向萬億參數級大模型訓練與推理。從核心參數來看,該超節點(Super Pod)包含576顆Rubin Ultra GPU(代號“Kyber”),設計目標為實現15 EFLOPS(FP4推理)與5 EFLOPS(FP8訓練)算力,將是GB 300 NVL72(Blackwell架構代表性產品)的14倍。
公開報道顯示,作為系統計算核心,Rubin Ultra GPU由兩塊掩模尺寸的GPU組成,擁有288GB HBM4內存,FP4峰值推理能力可達50 PFLOPS,預計2026年下半年上市。得益于這一強勁性能,NVL576可單機柜完成萬億參數模型(如GPT-4級別)訓練,且訓練周期較此前大幅縮短,預計將從數月縮減為數周。
ScaleX萬卡超集群:部分技術與能力已超越NVL576
在AI大模型參數規模從千億向萬億躍遷的當下,算力規模與效率成為制約產業發展的關鍵因素。高端AI硬件供給受限、軟硬件生態割裂、算力成本高昂等問題,曾如“性能墻”一般阻礙中國AI產業升級。中科曙光ScaleX萬卡超集群的亮相,首次展示了國產AI計算在系統級架構上的突破。該集群憑借四大優勢,實現了算力密度、傳輸效率、智能調度等方面的全面提升。優勢1:全球首創單機柜級640卡超節點。ScaleX萬卡超集群由16個曙光ScaleX 640超節點通過ScaleFabric高速網絡互連而成,可實現10240塊AI加速卡部署,總算力規模超5 EFLOPS。作為全球首個單機柜級640卡超節點,ScaleX 640采用超高密度刀片、浸沒相變液冷等技術,將單機柜算力密度提升20倍,PUE值低至1.04。
優勢2:自主研發原生RDMA高速網絡。曙光ScaleFabric網絡基于國內首款400G類InfiniBand的原生RDMA網卡與交換芯片,可實現400Gb/s超高帶寬、低于1微秒端側通信延遲,超節點間通信性能達到業內領先水平,能充分釋放萬卡超集群算力,且可將超集群規模輕松擴展至10萬卡以上。相較于傳統IB網絡,其性能提升2.33倍,同時網絡總體成本降低30%。
優勢3:存、算、傳緊耦合深度優化。通過“超級隧道”、AI數據加速等設計,實現從芯片級、系統級到應用級的三級數據傳輸協同優化,使存力平臺高效應對大模型訓練時萬卡并發讀寫帶寬的極致需求,提升高通量AI推理的響應速度與結果精準度,并可將AI加速卡資源利用率提高55%。
優勢4:超集群數字孿生與智能調度。通過物理集群數字孿生,實現故障定位、修復等全流程可視化智能管理;智能化運維平臺可支撐集群長期可用性達99.99%;智能調度引擎可管理萬級節點、服務十萬級用戶,支持每秒萬級作業調度。
除技術突破外,ScaleX萬卡超集群的發布更標志著國產AI算力生態從“單點突圍”邁向“生態共進”的關鍵轉折。2025年9月,中科曙光已協同20多家AI產業鏈企業推出“AI計算開放架構”,通過共享關鍵共性技術,推進智算集群的協同創新。
在中科曙光看來,相較于技術、產品、解決方案層面的突破,整個智算生態系統的構建更為重要。縱觀歷史上關鍵技術的普及軌跡,主要有兩條可選路徑:一是依靠少數巨頭打造的封閉式全棧垂直體系,二是基于開放架構、由產業鏈各環節共同參與的協作生態。兩者并非非此即彼的替代關系,但前者往往占據強勢地位,后者要贏得發展空間必須付出巨大努力。
對國內智算產業而言,當前面臨的挑戰紛繁復雜,亟需整合產業鏈上的大量企業,實現真正的跨層協作優化,進而打造開放式、標準化、高效率的集群算力,才能在日趨白熱化的競爭中掌握主動權。不過,這條道路充滿荊棘,橫亙在前方的技術墻與生態墻極難跨越,市場呼喚開路先鋒的引領與垂范。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
發布評論請先 登錄
相關推薦
熱點推薦
華為領銜,三劍客入局!十萬卡智算集群落地,國產算力芯片強勢崛起
中國移動宣布,將持續加大對人工智能領域的投入力度,總體投入翻一番,建成國內規模最大、技術領先的智算基礎設施,探索十萬卡智算集群建設,全國產智
支持算力卡擴展的RK3588國產工控機,實現AI性能25TOPS按需升級
多路高清視頻實時分析、大規模模型推理等,算力仍有提升空間。NIS-5128國產工控機,以其精巧的機身和創新的PCIE擴展能力,給出了一個極具前瞻性的解決方案:支持外
中科曙光3套scaleX萬卡超集群落地國家超算互聯網鄭州核心節點
2月5日,由中科曙光提供的3套萬卡超集群系統在國家超算互聯網鄭州核心節點同時上線試運行,成為全國首個實現3
中科曙光scaleX萬卡超集群重塑超大規模算力基礎設施
在“人工智能+”行動深入推進的當下,算力基礎設施已成為國家戰略競爭力的核心,而超大規模集群的運維管控難題卻日益凸顯。中科曙光scaleX萬
墨芯人工智能千卡集群正式簽約入駐新疆算力中心
在“東數西算”國家工程全面推進的大背景下,新疆憑借其豐富的清潔能源和獨特的區位優勢,正迅速崛起為國家級算力網絡的關鍵樞紐。近日,墨芯人工智能(以下簡稱“墨芯”)的千卡
部分能力超越2027年NVL576,中科曙光發布scaleX萬卡超集群
系統首次以真機形式亮相。 “scaleX萬卡超集群,是曙光發揮大型計算機系統研制經驗優勢,面向萬億參數大模型、科學智能等復雜任務場景打造的大規模智能算
發表于 12-18 18:30
?1154次閱讀
從萬卡集群到十萬卡集群,燧原科技始終踐行算力普惠
健康、教育等垂直領域,對算力設施有著更加廣泛的需求,包括智算中心和訓推一體機等。 ? 在 2025 世界人工智能大會暨人工智能全球治理高級別會議(WAIC 2025)上,作為國產人工智
發表于 07-30 09:54
?4658次閱讀
燧原科技國產萬卡集群通過中國信通院權威認證
近日,中國信息通信研究院(以下簡稱“中國信通院”)成功召開萬卡智算集群服務推進方陣年中總交流會。會議期間,中國信通院重磅發布了首批《大規模智算
總算力5EFLOPS!可擴展至10萬卡,國產算力集群部分性能超越NVL576
評論