12月13日,GAIR 2025「AI 算力新十年」專場在深圳舉行。作為國內前沿技術與產業變革的重要風向標,GAIR大會歷經七屆積淀,見證并推動了中國 AI 產業從算法突破、硬件迭代,到商業落地的完整過程。本屆論壇直面智能體系的底層核心——算力,從架構、生態、工具鏈到產業化落地,探尋未來十年的關鍵變量。
云天勵飛副總裁羅憶出席并發表主題演講,圍繞大模型從“訓練競賽”走向“推理規模化”的產業拐點,分享了面向推理時代的關鍵判斷與實踐思考。
羅憶指出,過去幾年行業主要通過更大算力、更大數據、更大參數推動智能上限持續提升,但隨著應用從簡單問答走向長上下文、工具調用與更復雜的智能體形態,產業關注點正在發生遷移:不再止步于“把模型煉得更強”,而是更強調“把推理做得更便宜、更穩定、更可規模化交付”。
在這一背景下,大模型應用面臨的核心挑戰正逐步呈現為“經濟學困境”——模型規模擴大帶來的算力與帶寬成本上升具有明顯的放大效應,只有通過稀疏化、蒸餾、量化等技術與工程優化持續降低門檻,AI 才可能從“高成本探索”走向“規模化普惠”。
圍繞推理時代的衡量標準,羅憶進一步強調,競爭指標不應僅停留在芯片的理論算力峰值,而應回到“單位投入能夠產出多少有效 token”。
這意味著,系統瓶頸往往不在算力本身,而在內存與互連帶寬,以及由此帶來的算力等待與利用率下降;在相近硬件條件下,誰能提升 MFU(算力/模型利用率)、減少無效等待,誰就更有機會把單位 token 成本攤薄到更具商業可行性的區間,從而支撐推理應用的規模化落地。
在國產 AI 推理芯片的發展方向上,羅憶提出三點思路:一是加強軟件生態兼容,在更好承接算法迭代的同時提升算力利用效率;二是突破存儲與帶寬相關瓶頸,積極支持 3D memory 等技術路線;三是面向異構計算持續優化整體性價比,以更可持續的成本結構推動應用滲透。
他同時表示,行業的共同目標應是讓推理服務的成本持續下探,并在未來三到五年推動“百萬 token 成本降至 1 元以內”成為可觸達的目標區間,從而更好支撐“人工智能+”在千行百業的普及。
云天勵飛自2014年成立以來,一直堅持算法與芯片的協同迭代,聚焦推理場景推動技術與產品的持續演進。目前,公司正探索面向云端推理的新型架構方向——GPNPU,力求在兼顧通用性與效率的同時,最大限度降低開發和遷移的門檻。
面向推理規模化的新階段,云天勵飛將繼續以“更高效、更普惠的推理算力”為目標,推動從芯片到系統再到交付的工程能力建設,與產業伙伴共同完善生態與應用路徑,讓算力投入更高效地轉化為可度量、可復制的業務價值,形成從“算力基建”到“價值閉環”的正向循環。
-
AI
+關注
關注
91文章
39776瀏覽量
301373 -
算力
+關注
關注
2文章
1530瀏覽量
16741 -
大模型
+關注
關注
2文章
3650瀏覽量
5181
原文標題:GAIR 2025|從訓練競賽到推理經濟學,AI 算力進入新十年變量期
文章出處:【微信號:IntelliFusion2,微信公眾號:云天勵飛】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
百億Token一分錢!云天勵飛喊出“推理成本萬倍降”,公布三年三芯路線圖
云天勵飛出席GAIR 2025 AI算力新十年專場
評論