當大模型從技術探索邁向規模化應用深水區,“算力供需失衡”與“推理成本高企”已成為制約產業發展的關鍵瓶頸。
在近期舉辦的ICCAD2025“IC設計與應用創新論壇”上,云天勵飛副總裁羅憶發表主題演講,立足全球AI算力格局從訓練轉向推理的時代變局,解讀了通過基礎設施優化實現推理降本的核心邏輯,并重點分享了云天勵飛創新的GPNPU架構,為國產AI芯片的發展提供了切實可行的思路。
行業雙拐點將至:推理算力成主力,國產芯片迎替代窗口期
“從訓練‘狂飆’到推理‘深耕’,AI產業正進入價值落地的關鍵階段。”羅憶在演講中開篇點題。他引用數據稱,2025年年中我國AI日均Token推理量已突破30萬億,一年半內增長超300倍;預計到年底,AI推理算力消耗將首次超過訓練,成為驅動算力需求的核心引擎。
與此同時,國產芯片的替代浪潮正在加速。在海外高端GPU供應受限及國內“人工智能+”行動等政策支持的雙重影響下,國產AI芯片市場占比持續提升,預計年底其使用量有望首次超越國外芯片,迎來歷史性的替代窗口期。羅憶強調:“第四次工業革命中,AI推理芯片是核心。中國要實現算力自主可控,必須在效率與成本上找到差異化突破路徑。”
解碼AI推理降本:四個維度協同優化提升大模型推理性價比
大模型規模化落地的核心挑戰,在于“效果-性能-成本”的平衡難題,高質量大模型推理的百萬Token成本高企,是產業規模化的重要瓶頸。
云天勵飛給出了“Token經濟學公式”:百萬Token成本 = (年資本開支+年營運成本) ÷ (加速卡年吞吐量×設備利用率),將大模型推理成本優化指向“硬件投入、運維消耗、軟件優化、生態適配”四個維度。
云天勵飛解法:GPNPU 打造國產自主算力底座
面對國產工藝約束與產業規模化需求,云天勵飛創新性提出 GPNPU架構,核心是融合 GPU 的通用性與 NPU 的高能效,通過“算力積木” 架構、3D 堆疊存儲等關鍵技術破解行業痛點。“算力積木” 架構實現了國產工藝下的全鏈路自主可控,達成 “一次流片、多規格輸出”,算力覆蓋 8T 至 256T,貫穿端、邊、云全場景部署需求。
羅憶最后提到,云天勵飛正加速迭代第五代GPNPU架構“Nova 500”,聚焦帶寬與能效升級,全力沖刺“百萬Token成本1元內”目標。未來,云天勵飛愿攜手產業鏈伙伴,讓算力從精英資源走向普惠,成為社會智能化的公共底座,為中國搶占第四次工業革命制高點貢獻力量!
-
IC設計
+關注
關注
38文章
1397瀏覽量
108373 -
gpu
+關注
關注
28文章
5235瀏覽量
135901 -
云天勵飛
+關注
關注
0文章
184瀏覽量
12686
原文標題:ICCAD 2025|解碼AI推理降本之道,GPNPU創新架構筑牢國產算力底座
文章出處:【微信號:IntelliFusion2,微信公眾號:云天勵飛】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
銳成芯微四大IP平臺亮相ICCAD-Expo 2025
華大九天亮相ICCAD-Expo 2025
安路科技亮相ICCAD-Expo 2025
中芯國際亮相ICCAD-Expo 2025
行芯科技亮相ICCAD-Expo 2025
中科芯亮相ICCAD-Expo 2025
成都華微亮相ICCAD-Expo 2025
芯行紀亮相ICCAD-Expo 2025
旋極星源亮相ICCAD-Expo 2025
英諾達亮相ICCAD-Expo 2025
奇捷科技亮相ICCAD-Expo 2025
芯盛智能亮相ICCAD-Expo 2025
芯原精彩亮相ICCAD-Expo 2025
云天勵飛亮相ICCAD-Expo 2025
評論