開年后,隨著DeepSeek席卷千行百業,昆侖芯率先適配、業內首家單機部署滿血版展示卓越性能,并在互聯網、科研、金融等領域實現規模部署,一系列進展引發廣泛關注。剛剛落幕的Create2025百度AI開發者大會上,昆侖芯作為底層算力核心被高頻提及,三萬卡集群點亮振奮人心,昆侖芯超節點也在大會上正式發布。
自ChatGPT問世,大模型參數快速增長,單卡顯存無法容納越來越大的模型參數,大模型對AI算力系統的并行通信能力提出越來越高的要求;同時開源MoE模型在多專家并行過程中也需要更高的通信效率。DeepSeek-V3/R1加速產業落地,AI算力集群對系統可擴展能力的需求變得空前迫切。
基于對大模型演進趨勢及算力需求的前瞻預測,昆侖芯團隊率先布局、潛心研發,面向大規模算力場景推出超節點新品,為AI算力集群性能優化和效率提升提供一套全棧解決方案。
1
全互聯通信帶寬提升8倍
訓推性能跨越式提升
通過硬件架構創新,昆侖芯超節點突破傳統單機8卡產品形態,超高密度設計使得單柜可容納32/64張昆侖芯AI加速卡。單柜內卡間實現全互聯通信,帶寬提升高達8倍,一個機柜的算力最高可達到傳統形態下8臺8卡服務器,實現對MoE大模型單節點訓練性能5-10倍、單卡推理效率13倍的大幅提升。
2
整柜功率可支持到120kW
大幅降低PUE
在能耗和散熱方面,昆侖芯積極響應節能降耗政策,采用高效的冷板式液冷方式進行系統散熱,整柜功率可支持到120kW,大幅降低數據中心的PUE(Power Usage Effectiveness,數據中心消耗的所有能源與IT負載消耗的能源的比值)。不僅如此,昆侖芯超節點支持液冷系統的漏液檢測,可及時針對液冷故障進行預警、告警、修復等,最大化提高整機柜系統無間斷穩定運行效率。
3
機柜間IB/RoCE通信
高帶寬、低延遲
當前,各級政府、眾多行業和頭部企業集中發力,正在加快建設一批超大規模智算中心。針對集群拓展需求,昆侖芯超節點機柜間支持IB/RoCE通信,可實現跨柜高帶寬、低延遲的數據傳輸,支持萬卡以上規模的智算集群構建。
4
自研XPU Link
兼容主流scale-up通信標準
昆侖芯自研互聯通信協議XPU Link,秉承一貫的“共生共贏”發展理念,昆侖芯XPU Link兼容業界主流scale-up通信標準,與上下游合作伙伴共建超節點行業生態,攜手推動國產AI算力在超節點集群中的規模部署和產業應用。
顛覆式的大模型和AI應用加速推動AI步入產業落地新階段。AI下半場,昆侖芯憑借在芯片架構、集群系統、軟件生態領域的深厚積累和全棧優勢,競爭實力越發凸顯。
目前,昆侖芯已實現三代產品大規模部署落地,通過與數百家客戶緊密合作,將AI算力輸送到互聯網、運營商、智算、金融、能源電力、汽車等等千行萬業,惠及數以億計的終端用戶。面向未來,昆侖芯將持續深耕AI芯片技術研發和產業應用,為我國AI產業發展注入源源不斷的澎湃動力。
-
昆侖芯科技
+關注
關注
0文章
40瀏覽量
1093 -
大模型
+關注
關注
2文章
3648瀏覽量
5176
原文標題:重磅發布!昆侖芯超節點產品推出,大模型訓推任務性能跨越式提升
文章出處:【微信號:昆侖芯科技,微信公眾號:昆侖芯科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
燧原科技訓推一體芯片L600適配階躍星辰基座模型Step 3.5 Flash
AutoDrill 推出創新型在線產品配置器,提升客戶體驗
逐點半導體與數字光芯達成戰略合作,引領新型顯示技術產業跨越式發展
昆侖芯科技參與發布超節點智算應用“北京方案”
開源大模型算力革命下:電子谷連接技術的堅守與未來
昆侖芯超節點產品推出,大模型訓推任務性能跨越式提升
評論