日前,云天勵飛中標湛江市AI滲透支撐新質生產力基礎設施建設項目。根據項目規劃,公司將基于自研國產AI推理加速卡,參與建設AI推理算力集群,并推動DeepSeek等國產大模型在相關應用場景中的適配與部署,為政務和產業數字化應用提供算力基礎設施支持。
面向大模型應用構建推理算力基礎設施
本次項目建設的AI推理算力集群將圍繞大模型推理任務需求進行系統設計。
在大模型推理過程中,不同計算階段對系統資源的需求存在差異。當前業界普遍采用“Prefill–Decode分離”的推理架構,通過針對不同階段的資源配置優化,提高整體系統運行效率。
在該架構下,Prefill階段主要負責長上下文理解和計算,對算力和帶寬需求較高;Decode階段則持續生成Token,對系統延遲更加敏感。項目建設過程中,將結合不同階段的特點進行算力資源配置和系統優化。
同時,隨著模型上下文長度不斷增加,大量中間狀態需要以KV Cache形式存儲。圍繞這一特點,項目在系統設計中對計算、存儲與網絡之間的協同進行了優化,以提升數據訪問效率和整體系統性能。
在網絡架構方面,系統將采用統一高速互聯架構,通過400G光網絡構建集群物理層網絡,實現節點之間的高帶寬、低延遲通信,并支持從單節點數十卡規模擴展至千卡級集群規模,以滿足不同規模AI應用需求。
項目整體建設完成后,將形成面向大模型推理任務的算力基礎設施,為相關應用場景提供穩定的算力支撐。
持續推進AI推理芯片與算力系統技術研發
根據項目規劃,本次AI推理算力集群將分三期建設,并將采用云天勵飛自研的國產AI推理加速卡。
一期項目將部署云天勵飛 X6000 推理加速卡;未來將率先搭載公司最新一代芯片產品。
在AI推理芯片研發方面,云天勵飛正持續推進面向不同推理階段的技術布局。根據公司戰略規劃,未來將逐步推出針對Prefill階段優化的芯片產品,以及面向Decode階段低延遲需求的推理芯片,并通過系統級協同優化進一步提升整體推理效率。
其中,公司首款面向長上下文推理場景優化的Prefill芯片DeepVerse100預計將在年內完成流片,并計劃在相關算力系統中開展部署。
在長期技術規劃方面,公司提出“1001計劃”,即以“百億Token一分錢”為長期目標,通過芯片架構與算力系統協同優化,持續推動大模型推理成本下降。
未來,公司將繼續推進AI推理芯片相關技術研發,推動人工智能技術在更多行業中的普惠落地。
-
集群
+關注
關注
0文章
149瀏覽量
17683 -
AI
+關注
關注
91文章
40696瀏覽量
302339 -
云天勵飛
+關注
關注
0文章
184瀏覽量
12692
原文標題:4.2億!云天勵飛開門紅,中標湛江AI推理千卡集群項目
文章出處:【微信號:IntelliFusion2,微信公眾號:云天勵飛】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
云天勵飛中標湛江市AI滲透支撐新質生產力基礎設施建設項目
評論