智譜AI正式上線并開源全新一代大模型GLM-5。作為面向復雜系統工程與長程Agent任務打造的新一代模型,GLM-5在Coding與Agent能力上實現開源SOTA表現,在真實編程場景中的使用體驗已逼近Claude Opus 4.5。當前,昆侖芯完成Day 0深度推理適配。通過底層算子優化與硬件加速能力,GLM-5已在昆侖芯產品上實現高吞吐、低延遲的穩定運行。
Day 0適配落地,軟硬協同助推高效部署
在本次Day 0適配合作中,昆侖芯團隊深度協同智譜AI,依托在底層算子優化與工具鏈建設方面的長期技術積累,圍繞GLM-5的模型結構與推理特性開展了針對性的聯合優化。雙方在模型正式上線前,即完成適配與性能調優,確保發布當日實現穩定、高效運行。本次適配不僅實現Day 0支持,更在兩大主流開源推理框架vLLM與SGLang上完成驗證落地。在算力層面,昆侖芯高性能算子快速完成對GLM-5的DSA與MoE架構適配,并結合INT8量化、MTP優化及雙機PP并行等技術手段,顯著提升GLM-5在昆侖芯集群環境下的推理吞吐與整體運行效率。
昆侖芯軟件負責人王勇表示:“GLM-5的Day 0深度推理適配,是昆侖芯軟件生態能力和軟硬件協同能力的一次集中體現。通過底層算子重構與推理框架協同優化,我們實現了模型結構特性與硬件架構能力的深度匹配,確保模型在上線首日即可穩定釋放高性能算力。”
此次高效適配,得益于昆侖芯自研軟件棧的出色兼容性和高效適配能力。昆侖芯提供從驅動到專用庫的完備軟件棧,全面覆蓋模型開發與部署關鍵環節。該軟件棧高度兼容主流AI開發生態,在保障計算性能充分釋放的同時,有效降低開發門檻與模型遷移成本,使客戶能夠以更低的適應成本與更短的部署周期完成AI模型開發與部署落地。
堅實算力底座,萬卡集群支撐大規模應用
截至目前,昆侖芯已與國內外多款主流大模型完成適配,其中多個模型更實現“發布即適配、上線即可用”。面向企業及開發者,昆侖芯正持續完善模型適配與部署能力,全面支持各類模型架構與算法創新,助力開發者獲得更流暢、高效的開發與部署體驗。
在集群建設方面,2025年2月,昆侖芯成功點亮昆侖芯P800萬卡集群,這是國內首個正式點亮的自研萬卡AI集群。同年4月,該集群規模進一步擴展至3.2萬卡。未來,昆侖芯還將不斷支持國產算力集群建設,推動模型在真實場景中的規模化應用,助力國產模型的創新發展。
軟硬協同創新,共建國產AI開放生態
未來,昆侖芯將持續深耕全棧技術研發,強化軟硬協同與生態共建能力,為國產算力高質量發展提供強勁動能。昆侖芯將攜手生態伙伴與開發者深化國產模型與國產算力融合創新,共建開放共贏的大模型生態,加速AI技術在更多真實產業場景中的規模化落地應用,推動國產算力高質量發展。
-
昆侖芯科技
+關注
關注
0文章
40瀏覽量
1093 -
大模型
+關注
關注
2文章
3648瀏覽量
5179
原文標題:昆侖芯Day 0適配智譜全新一代大模型GLM-5
文章出處:【微信號:昆侖芯科技,微信公眾號:昆侖芯科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
大模型 ai coding 比較
寒武紀實現對GLM-5的Day 0適配
Day-0支持|摩爾線程MTT S5000率先完成對GLM-5的適配
沐曦曦云C500/C550 GPU產品適配智譜GLM-OCR模型
百度正式發布并開源新一代文檔解析模型PaddleOCR-VL-1.5
從零開始安裝并配置開源AI編程神器OpenCode
智譜AI正式上線并開源全新一代大模型GLM-5
評論