2025年11月23日,第二十二屆中國國際半導體博覽會(IC China 2025)在北京國家會議中心啟幕。在24日舉辦的“人工智能及大模型芯片論壇” 上,云天勵飛智算研究院副院長沈宇亮發表主題演講,深度解析大模型時代推理算力變革趨勢,分享以 GPNPU 創新架構為核心的全場景產品布局。
時代變局:推理需求爆發,國產芯片迎戰略機遇
從AlexNet 開啟深度學習,到 ChatGPT 引爆大模型革命,AI 已從感知智能邁入認知智能,成為第四次工業革命核心驅動力。中國憑借數據規模、場景開放與工程化創新三重優勢,正緊跟全球技術前沿,在AI賽道形成獨特競爭力。
2025年作為“AI Agent 落地元年”,大模型迭代周期壓縮至周甚至小時級,國內外主流模型密集升級,開源低成本模型推動 AI 推理規模化發展,Token 消耗量指數級增長,算力需求重心從訓練全面轉向推理。沈宇亮指出,AI 基礎設施已進入以“高效推理”為核心訴求的算力基建2.0 時代,疊加海外高端 GPU 供應受限與 “人工智能 +” 政策支持,國產推理芯片迎來前所未有的機遇。
技術破局:GPNPU架構實現“百萬 Token”極致性價比
針對云端推理的性能、成本、精度挑戰,云天勵飛創新提出GPNPU(General-Purpose Neural Processing Unit)架構,核心路徑是融合 GPU 通用性與 NPU 高能效。以 “算力積木” 設計和 3D 堆疊存儲為核心創新,聚焦提升 “資本開支Token轉化率” 與 “運營開支 Token 轉化率”,通過全棧協同優化,為大模型組合應用與復合智能體部署提供核心算力支撐,實現 “百萬Token的極致性價比”。
全場景布局:賦能AI 規模化落地
架構創新是國產芯片差異化突破的關鍵。深耕AI芯片十余年的云天勵飛,已商用四代 NPU 架構芯片,構建起覆蓋云邊端全場景的推理芯片矩陣:面向云端大算力推理的“深穹”系列,為互聯網大廠與企業級用戶提供國產算力支撐;面向邊緣計算的“深界”系列,已應用于家庭計算主機等產品開發;面向具身智能的“深擎”系列,服務新興智能機器人領域。
正在研發的NOVA 500系列將全面升級 GPNPU 架構,通過3D堆疊存儲與軟硬協同設計,實現生態兼容性、性能與能效三重提升;NOVA 600系列將探索光電一體化互聯,構建高性價比算力網絡,力爭將每百萬 Token 推理成本降低百倍以上,降至分級成本水平。
未來,云天勵飛將持續深耕GPNPU 架構迭代與產品創新,聚焦推理算力的性能突破與成本優化,攜手產業鏈伙伴深化生態合作,構建覆蓋“架構-芯片-方案-應用”的高效 AI 推理生態,助力中國在第四次工業革命中搶占全球 AI 算力制高點。
-
半導體
+關注
關注
339文章
30730瀏覽量
264054 -
人工智能
+關注
關注
1817文章
50094瀏覽量
265302 -
云天勵飛
+關注
關注
0文章
182瀏覽量
12652
原文標題:IC China2025 | GPNPU架構創新,引領AI算力基建2.0時代
文章出處:【微信號:IntelliFusion2,微信公眾號:云天勵飛】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
愛芯元智亮相2025中國國際半導體博覽會
云天勵飛亮相2025中國國際半導體博覽會
評論