智算集群的發展浪潮正以超乎想象的速度襲來,未來五年,十萬卡級的算力集群將成為標配。但一個核心挑戰也隨之而來:當成千上萬的芯片緊密堆疊,如何將產生的巨額熱量快速帶走?
全球領先的大規模智能計算系統——曙光scaleX萬卡超集群,總算力超5EFlops。曙光數創的浸沒相變液冷技術,以900kW的單柜功率、高達200W/cm2的極致散熱效率、低至1.04的PUE表現,為超集群提供了高效、穩定、可持續的散熱保障。而極致算力的背后,是材料、系統、控制等方面的持續創新。
高密算力的“主動脈”
如果把算力集群比作人體,供電系統就是為全身輸送血液、維持身體機能正常運轉的主動脈。曙光數創以高效穩定供配電技術,支撐高密算力7x24小時不間斷平穩運行。
多源智能供電:支持市電、柴發、電池等多類電源的同步接入與智能靈活配比,從源頭保障供電穩定。
快速精準調電:電流響應速度大于2.5A/μs,實現供電與算力負載的實時匹配,支持多電壓等級的高精度穩壓(±0.5%)。
模塊化與高密部署:采用模塊化設計與預制化母排,系統效率超過96%,節能的同時優化空間利用與運維便利性。
全方位安全防護:構建含冗余供電與末端防浪涌的保護網絡,集成智能監控與安全聯動功能,實現從預警到斷電的主動防護。
給芯片泡個“冷水澡”
主流芯片熱設計功耗(TDP)持續攀升,傳統風冷如同在桑拿房里扇扇子,散熱能力早已觸及天花板。曙光數創的相變浸沒液冷技術將電子元器件100%浸入冷媒中,并通過材料、傳熱、密封等創新,讓芯片安心泡上“冷水澡”。
冷媒特性與材料兼容性:冷媒材料具備低沸點、高潛熱、強絕緣、環保無害等特性,換熱性能和穩定性進一步提升,成本大幅降低,并通過數萬小時兼容性測試,確保與電子元器件良好兼容。
強化傳熱與信號保障:通過散熱器表面處理工藝提高換熱效率,同時優化全浸環境下信號傳輸的完整性與可靠性。
結構密封與機電轉接:采用專用密封技術與穿壁連接器,構建氣液相變循環的“高速公路”,確保系統長期運行無泄漏。
讓液冷系統“會思考”
高密集群面臨負載波動與環境變化,散熱系統也要能“隨機應變”。曙光數創的相變換熱自動控制技術通過四層機制,實現智能精準管理。
參數精確控制:實時調節冷媒流量、溫度與壓力,防止芯片超溫、服務器損壞等問題。
系統智能模擬:采用神經網絡等方法模擬相變換熱動態行為,為控制器提供優化依據。
故障診斷處理:采用串級雙層閉環結構及模型預測,穩定、快速、準確應對負載變化。
全局能效調優:通過優化供液方案、匹配負載與能耗等方式,提升能源利用效率。
從精密工程到智能控制,從材料創新到系統集成,曙光數創的液冷技術不僅破解了功耗與密度矛盾,更在AI深入賦能千行百業的當下,推動了智算基礎設施向高效、低碳持續演進。
-
集群
+關注
關注
0文章
142瀏覽量
17661 -
中科曙光
+關注
關注
5文章
495瀏覽量
18908 -
算力
+關注
關注
2文章
1528瀏覽量
16741
原文標題:特寫丨冷靜下來,萬卡智算才夠穩
文章出處:【微信號:sugoncn,微信公眾號:中科曙光】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
中科曙光scaleX萬卡超集群重塑超大規模算力基礎設施
中科曙光scaleX萬卡超集群亮相中國制造“十四五”成就展
總算力5EFLOPS!可擴展至10萬卡,國產算力集群部分性能超越NVL576
部分能力超越2027年NVL576,中科曙光發布scaleX萬卡超集群
中科曙光scaleX萬卡超集群背后的持續創新
評論