3月12日,中科曙光宣布實現國產高端原生RDMA技術重大突破,正式發布首款全棧自研400G無損高速網絡——scaleFabric。該產品基于原生RDMA架構,從底層的112G SerDes IP、硬件設備到上層的管理軟件實現100%自主研發,填補了國內數據中心高速網絡領域的空白,以比肩國際頂尖同類產品的性能表現,為超大規模智算集群鋪就了一條高帶寬、低時延、真無損、超可靠的“算力大動脈”。

高端智算互聯待破局
在大規模智算集群領域,RDMA(遠程直接內存訪問)網絡已成為算力中心的基本需求,憑借零丟包、高帶寬、低延遲等特征,可極大提升通信效率。其中,InfiniBand憑借低時延與原生無損傳輸能力,在全球頂級超算與AI集群中被廣泛采用。根據TOP500榜單,目前全球約60%的高性能計算系統采用InfiniBand網絡架構。
長期以來,從高速SerDes IP、核心芯片到IB網卡、IB交換機等設備,InfiniBand相關產業鏈基本被海外廠商壟斷。隨著AI算力需求快速增長及數據中心網絡持續演進,自主高性能RDMA網絡正成為產業關注焦點。中國工程院院士鄔賀銓表示,高速網絡作為算力基礎設施的核心關鍵技術,其自主可控性直接關系到國家算力基礎設施的安全與發展質量。在大模型訓練和智算集群規模化部署背景下,網絡需要同時具備超低延遲、超高帶寬與無損傳輸能力,而RDMA高速網絡正是智算集群的“算力大動脈”。

中國工程院院士?鄔賀銓 視頻致辭
國產原生RDMA問世
scaleFabric是國內首款原生無損RDMA高速網絡,面向超大規模智算集群設計,從核心關鍵IP、交換芯片、網卡到交換機、驅動與管理軟件均實現自主研發,構建起從硬件到軟件的完整技術體系。
此次發布的scaleFabric400系列網絡產品技術規格全面對標英偉達NDR,部分指標實現趕超。性能方面,scaleFabric400網卡基于PCIe5.0接口,端口帶寬達400Gbps,端到端通信時延低至0.9微秒;scaleFabric400交換機單端口帶寬達800Gbps,整機交換容量可達雙向64Tbps,交換時延約260納秒,支持800G×40或400G×80端口擴展。這一性能組合,可充分滿足萬卡級AI訓練集群對高帶寬、低時延網絡的極致需求。
穩定性與擴展能力上,產品采用基于信用的無損流控機制,從根源規避擁塞丟包風險,鏈路故障恢復時間小于1毫秒,已支撐近萬卡集群持續穩定運行驗證超10個月。與英偉達NDR相比,交換機端口密度提升25%,網卡最大QP數支持提升100%,單子網互連規模是傳統IB的2.33倍,可輕松支持最大11.4萬卡集群部署,同時網絡總成本可降低30%。
在大規模AI訓練系統中,網絡互聯能力已成為影響算力利用率的關鍵變量。scaleFabric的發布,標志著國產智算網絡在高端RDMA領域實現重大突破。
萬卡集群率先驗證
在實際應用層面,scaleFabric目前已部署于國家超算互聯網鄭州核心節點,支撐三套萬卡級scaleX智算集群上線運行,總規模達3萬卡。中科曙光高級副總裁李斌表示,隨著產品在超大規模智算集群中的落地應用,國產原生RDMA技術路線正逐步走向成熟,圍繞其形成的高性能網絡產業生態也正在加速形成。

運行數據顯示,該網絡系統在大規模集群環境中保持穩定運行,可支持跨POD組網及大規模并行訓練任務,為國產原生無損RDMA網絡在高端智算基礎設施中的應用提供了實踐驗證。
依托在高性能計算、存儲與網絡領域的長期技術積累,中科曙光已逐步形成“算—存—網”協同發展的完整算力底座能力,為大規模AI基礎設施提供系統級支撐。隨著政府工作報告提出持續推進“人工智能+”,算力基礎設施正進入新一輪升級周期。國產原生RDMA網絡的落地,意味著我國在智算互聯這一關鍵環節開始形成自主技術路徑,補齊了我國智算基礎設施中的關鍵一環。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
發布評論請先 登錄
相關推薦
熱點推薦
海光 “鯨吞” 中科曙光,國產算力 “超級航母” 啟航!
,對中科曙光進行換股吸收合并,同時還將發行 A 股股票募集配套資金。根據安排,兩家公司 A 股股票自 5 月 26 日起停牌,預計停牌時長不超過 10 個交易日。 ? ? 值得關注的是,這是 5 月 16 日《上市公司重大資產重
國產InfiniBand網絡有多強?從此中國架起AI高速網絡!
。 算力網絡是智算集群的核心基礎條件之一。超高帶寬、極低延時、無損傳輸和擴展是超大規模智算集群對網絡提出的新要求。 ? 中科曙光自2022年開始進行
中科曙光推出國產自研原生RDMA高速網絡scaleFabric
AI算力集群正加速向萬卡、十萬卡級規模迭代,高速互連網絡作為算力高效釋放的“神經樞紐”,其性能、擴展性與穩定性直接決定集群整體效能。大規模集群組網需兼顧高帶寬、低延遲與無損傳輸,同時要適配算力指數級增長的擴展需求,還要控制組網成本與故障風險,現有方案難以全面平衡這些核心訴
中科曙光獲得中國商飛上航公司感謝信
近日,中國商飛上海航空工業(集團)有限公司(簡稱“上航公司”)向中科曙光發來感謝信,就曙光提供的國產高性能計算平臺等服務給予高度評價,充分肯定了曙光
2025年中科曙光DeepAI深算智能引擎完成全面進化
2025年,中科曙光DeepAI深算智能引擎完成了從技術突破到生態建設的全面進化。從2月全球開發者先鋒大會的正式發布,到5月榮獲中國信通院權威認證,再到9月世博會的全面開源開放,DeepAI正成為
總算力5EFLOPS!可擴展至10萬卡,國產算力集群部分性能超越NVL576
中國在高性能計算領域的又一次重大突破。 ? 中科曙光高級副總裁李斌表示,面對人工智能基礎設施對性能、效率、可靠性、可擴展性等方面的極致需求,ScaleX萬卡超集群在超節點架構、高速互連
今日看點:海光信息終止換股吸收合并中科曙光;國內本土企業全球首發地磁能發電技術
海光信息終止換股吸收合并中科曙光 ? 日前,海光信息披露公告稱,公司決定終止重大資產重組。公告顯示,海光信息原擬通過向中科曙光全體A股換股股
發表于 12-10 10:22
?1723次閱讀
中科曙光以算力生態賦能行業創新
的特點。“橘洲”背后則是由湖南匯視威科技依托中科曙光長沙人工智能創新中心國產算力自主研發。在人工智能國產化浪潮中,中科
中科曙光超智融合方案助力國產算力中心建設
近期,位于魯中南地區的某大型算力中心正式啟動建設,標志著國產算力技術在該區域數字經濟中的重要突破。該中心采用中科曙光“超智融合”方案,實現算力利用率提升40%目標,為區域數字經濟發展注
達坦能源TAPP智能無線井下壓力監測系統取得重大突破
近日,在陜北某區塊煤巖氣井測試中,達坦能源自主研發的TAPP智能無線井下壓力監測系統取得重大突破。
中科曙光與中科星圖在太空計算領域達成合作
伴隨空天信息產業的高速發展,太空計算正成為戰略新興技術高地。在此背景下,近日,中科曙光與中科星圖在合肥“2025空天信息大會”上,簽署了《太空計算領域的合作開發框架協議》。按協議,雙方
中科曙光構建全國產化基因組學高性能計算平臺
近日,中科曙光承建的國內某研究所基因組學高性能計算平臺正式交付。這是國內生物信息學領域首個從底層硬件到上層軟件實現完全自主可控,并深度融合高性能計算與人工智能算力的平臺,成功填補了該領域國產高端算力的空白。
中科曙光亮相2025國際超級計算大會
多元發展的態勢。而中科曙光憑借“超智融合” 技術體系,已在石油勘探、生物信息等領域實現多項國產首創突破,成為行業矚目焦點。
瑞風協同與中科曙光達成深度合作
近日,瑞風協同與中科曙光達成深度合作,雙方將圍繞aiEF大模型一體機展開全方位聯合研發,旨在打造“AI+工業”領域標桿解決方案。此次合作依托中科曙光
中軟國際在大型銀行AI項目領域實現重大突破
近日,中軟國際成功中標某全國性股份制銀行2025年大模型算力擴容項目,標志著中軟國際在大型銀行AI項目領域實現重大突破,進一步鞏固了其在金融科技領域的領先地位。
重大突破!中科曙光scaleFabric國產原生RDMA高速網絡首發
評論