2025年,人工智能產業步入規模化應用深水區,大模型技術迭代加速,對算力規模與效率提出更高要求。在這一背景下,9月,中科曙光依托國家先進計算產業創新中心,聯合產業鏈上下游20多家企業共同推出AI計算開放架構,推動產業從封閉走向開放,從單點突破走向系統優化。
系統創新:打造開放架構的硬件基礎
面對AI算力需求爆發式增長,曙光率先在硬件架構上實現突破。在11月的世界互聯網大會烏鎮峰會上,正式發布全球首款單機柜級640卡超節點scaleX640。scaleX640采用“一拖二”系統設計,單機柜實現最大640卡超高速總線互連,通過雙超節點組成千卡級計算單元。通過正交架構、浸沒相變液冷等技術,系統PUE降至1.04,算力密度相比業界傳統架構提升20倍。
在12月的光合組織人工智能創新大會上,曙光進一步推出scaleX萬卡超集群系統。現場展示的系統由16個scaleX640超節點通過自研scaleFabric網絡互連而成,依靠RDMA技術使萬卡集群并行效率得到顯著提升,總算力規模超過5EFlops,網絡總體成本降低30%。
在產品創新方面,基于AI計算開放架構理念設計的scaleX超節點及超集群系統,支持多品牌加速卡,兼容主流AI軟件生態,為突破AI算力瓶頸提供新選擇。目前,基于開放架構的系列產品已在高校、科研院所、企業等30多個行業領域獲得應用。
技術共享:構建五層開放能力體系
曙光認識到,真正的開放需要全棧技術能力的共享。中科曙光協同產業鏈伙伴,推進部件級、系統層、基礎設施層、軟件層和數據集等五層技術能力開放,降級創新門檻與研發成本,以促進算力普惠與生態創新。
基礎設施層面,曙光數創牽頭編制冷板式液冷系統國家標準,推動液冷技術標準化。軟件層面,曙光推出UPTK通用異構編程工具包,通過對異構計算運行時接口進行標準化定義,使開發者無需關注底層架構差異,即可實現“一套代碼、多端部署”。此外,曙光還推出OneScience科學大模型開發平臺、DeepAI深算智能引擎等模型軟件的開放共享。截至目前,模型下載量超80萬次,鏡像下載量超200萬次。數據層面,中科天機全球率先發布“高分辨率氣象數據共享計劃”,先后共享模式數據、歷史數據集、融合數據,實現了從比肩到超越歐洲中期天氣預報中心(ECMWF)數據的跨越式突破,賦能科研教育、新能源、低空經濟、農業、交通等行業,并驅動大模型革新。
產業協同:建立開放架構聯合實驗室
在產業協作方面,依托光合組織,曙光聯合20多家上下游企業共同推進建設“AI計算開放架構聯合實驗室”,重點解決芯片與基礎軟件協同、模型-硬件適配優化等實際問題,破解“硬件墻”“生態墻”壁壘。
此外,光合組織人工智能創新大會上還公布了科學智能聯合攻關行動、AI計算開放架構聯合實驗室首批項目組協同創新計劃,旨在匯聚頂尖力量,針對科學大模型、多元異構算力融合、統一基礎軟件棧、超大規模集群優化等共性關鍵技術開展聯合攻關,將開放協作深入研發源頭。
從單點突破到系統優化,曙光AI計算開放架構的實踐表明,通過產業鏈協同破解復雜技術難題,是推動中國智算產業可持續發展的可行路徑。這一探索不僅為行業提供技術解決方案,更在產業協作機制上積累了寶貴經驗。
-
AI
+關注
關注
91文章
39755瀏覽量
301359 -
人工智能
+關注
關注
1817文章
50094瀏覽量
265278 -
中科曙光
+關注
關注
5文章
495瀏覽量
18908
原文標題:2025答卷|開放,為了更好的計算
文章出處:【微信號:sugoncn,微信公眾號:中科曙光】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
2025年中科曙光DeepAI深算智能引擎完成全面進化
3年10億,攜手攻堅:“AI計算開放架構聯合實驗室”協同創新計劃正式啟動
2025年中科曙光聯合多家企業共同推出AI計算開放架構
評論