2月3日,云天勵飛正式舉辦“大算力芯片戰略前瞻會”,首次對外公布未來三年的大算力 AI 推理芯片戰略布局。面對人工智能從“基礎模型構建”邁向“規模化應用落地”的重要轉折點,公司宣布將核心研發資源集中于攻克大模型落地的“成本壁壘”,致力于通過底層架構創新,力爭實現百萬 Tokens 推理成本降低 100 倍以上的目標,推動 AI 從技術嘗鮮走向普惠生產力。

產業變局:推理競速,從“參數內卷”轉向“效能為王”
過去一年,全球算力產業的風向標已發生顯著偏轉,重心正加速向推理側傾斜。谷歌在 2025 年 4 月發布第七代 TPU “Ironwood”時,明確將其定位為“面向推理時代”的基石,強調在大規模推理與能效上的系統化優化。
與此同時,圍繞“更低時延、更低成本”的推理芯片與系統能力,產業整合動作也在加速。2025 年 12 月,英偉達與 Groq 達成非獨占許可安排,并吸納其核心工程人才團隊加入,此舉被視為強化推理與實時工作負載能力的關鍵布局。
這些行業信號共同指向一個趨勢:推理側競爭已不再單純是“把模型做得更強”的參數競賽,而是“讓應用跑得更久、更穩、更便宜”的效能競賽,單位推理成本與交付效率已成為規模化落地的最大門檻。
架構破局:GPNPU 路線重新定義“通用生態”與“極致能效”
推理時代的勝負手不在單點指標,而在系統級協同:既要承接主流軟件生態,又要在推理負載下實現更優能效與更低時延。
云天勵飛確立了 GPNPU 技術路線,并提出了“GPNPU = GPGPU + NPU + 3D 堆疊存儲”的核心公式,旨在兼顧通用計算的“通用性”與 NPU 的“高效性”,在工程層面同時解決可遷移、可部署、可持續降本三大難題。
在通用生態層面,鑒于 CUDA 仍是全球最成熟、覆蓋最廣的加速計算平臺之一,云天勵飛的 GPNPU 架構致力于正視主流生態的遷移成本問題,能夠實現一行代碼完成 CUDA 程序兼容,極大降低了進入生產系統的門檻。

在推理能效層面,NPU 能夠實現更高的計算效率和能效比,面對大模型推理這種高度結構化、可被體系化優化的負載,專用化設計帶來的能效優勢更容易轉化為真實成本優勢,這也是國際廠商持續加碼專用路線的重要原因。
同時,針對行業公認的“內存墻”瓶頸,云天勵飛正深度研發 3D 堆疊存儲及更前沿的互連技術,以提升帶寬與能效,降低推理時延。
在架構工程與產品化路徑上,云天勵飛進一步強調了兩項可落地的優勢。首先是“算力積木”架構,即通過 Chiplet 擴展與互連思路,將標準計算單元進行模塊化封裝與組合,讓算力像搭積木一樣按需擴展,形成從邊緣到更大規模推理的彈性產品形態。
其次是面向推理的系統級優化能力,公司拒絕單純的“芯片參數競賽”,而是主張把“模型怎么跑得更省”沉淀到架構里,圍繞真實業務負載持續迭代,逐項擊穿推理鏈路中的成本與時延瓶頸,最終形成可復制交付的綜合最優解。
五大核心要素構筑堅實護城河,將打造千卡集群
云天勵飛董事長兼 CEO 陳寧在演講中指出,支撐公司跨越周期的,是長期積累構筑的商業護城河。他將核心競爭力總結為技術、產能、生態、市場、資本五大關鍵要素。這五大維度的協同共振,不僅是云天勵飛應對行業激烈競爭的底氣,更為未來三年戰略的穩步落地提供了堅實的體系化保障。
針對行業普遍關注的供應鏈安全問題,云天勵飛高級副總裁、CFO 兼董秘鄧浩然特別強調,公司目前是國內屈指可數手握充足國產產能保障的企業之一,這一戰略儲備為后續芯片的大規模量產與交付提供了極高的確定性。
陳寧還詳細解讀了云天勵飛的“1+4”架構:“1”指聚焦于AI大算力推理芯片,“4”則是四大事業部。作為生態構建者,四大事業部旨在解決芯片從“研發生產、優化打磨到市場推廣”的核心難題。其中,政企事業部作為基石,將憑借深厚的行業經驗,將戰略重點轉向推理設備和智算中心的建設。此外,云天勵飛還計劃打造區域級“千卡集群”,樹立城市AI算力賦能的新標桿。
藍圖展開:DeepVerse 領銜,全場景算力矩陣精準卡位
面向未來三年的規劃,云天勵飛CTO李愛軍表示,將不遺余力投入大算力芯片DeepVerse的研發,圍繞推理成本、時延與吞吐的核心矛盾持續迭代,并按產品節奏梯度覆蓋市場需求。
路線圖將對標國際主流平臺的代際演進,聚焦長上下文預填充(Prefill)、低時延解碼(Decode)等關鍵推理階段的系統優化,在真實負載下持續兌現“更便宜、更穩定、更易部署”的交付目標。

推理時代的競爭,本質是“單位推理成本”的競爭。只有把推理做得足夠便宜、足夠穩定、足夠易用,AI 才能從“看得見的能力”走向“用得起的生產力”。
未來,云天勵飛將以 GPNPU 架構為核心,大力推進云端大算力強化軟硬協同與存儲體系攻堅,力爭將百萬 Tokens 推理成本降低 100 倍以上,推動大模型從示范應用走向規模化交付。

產業變局:推理競速,從“參數內卷”轉向“效能為王”
過去一年,全球算力產業的風向標已發生顯著偏轉,重心正加速向推理側傾斜。谷歌在 2025 年 4 月發布第七代 TPU “Ironwood”時,明確將其定位為“面向推理時代”的基石,強調在大規模推理與能效上的系統化優化。
與此同時,圍繞“更低時延、更低成本”的推理芯片與系統能力,產業整合動作也在加速。2025 年 12 月,英偉達與 Groq 達成非獨占許可安排,并吸納其核心工程人才團隊加入,此舉被視為強化推理與實時工作負載能力的關鍵布局。
這些行業信號共同指向一個趨勢:推理側競爭已不再單純是“把模型做得更強”的參數競賽,而是“讓應用跑得更久、更穩、更便宜”的效能競賽,單位推理成本與交付效率已成為規模化落地的最大門檻。
架構破局:GPNPU 路線重新定義“通用生態”與“極致能效”
推理時代的勝負手不在單點指標,而在系統級協同:既要承接主流軟件生態,又要在推理負載下實現更優能效與更低時延。
云天勵飛確立了 GPNPU 技術路線,并提出了“GPNPU = GPGPU + NPU + 3D 堆疊存儲”的核心公式,旨在兼顧通用計算的“通用性”與 NPU 的“高效性”,在工程層面同時解決可遷移、可部署、可持續降本三大難題。
在通用生態層面,鑒于 CUDA 仍是全球最成熟、覆蓋最廣的加速計算平臺之一,云天勵飛的 GPNPU 架構致力于正視主流生態的遷移成本問題,能夠實現一行代碼完成 CUDA 程序兼容,極大降低了進入生產系統的門檻。

在推理能效層面,NPU 能夠實現更高的計算效率和能效比,面對大模型推理這種高度結構化、可被體系化優化的負載,專用化設計帶來的能效優勢更容易轉化為真實成本優勢,這也是國際廠商持續加碼專用路線的重要原因。
同時,針對行業公認的“內存墻”瓶頸,云天勵飛正深度研發 3D 堆疊存儲及更前沿的互連技術,以提升帶寬與能效,降低推理時延。
在架構工程與產品化路徑上,云天勵飛進一步強調了兩項可落地的優勢。首先是“算力積木”架構,即通過 Chiplet 擴展與互連思路,將標準計算單元進行模塊化封裝與組合,讓算力像搭積木一樣按需擴展,形成從邊緣到更大規模推理的彈性產品形態。
其次是面向推理的系統級優化能力,公司拒絕單純的“芯片參數競賽”,而是主張把“模型怎么跑得更省”沉淀到架構里,圍繞真實業務負載持續迭代,逐項擊穿推理鏈路中的成本與時延瓶頸,最終形成可復制交付的綜合最優解。
五大核心要素構筑堅實護城河,將打造千卡集群
云天勵飛董事長兼 CEO 陳寧在演講中指出,支撐公司跨越周期的,是長期積累構筑的商業護城河。他將核心競爭力總結為技術、產能、生態、市場、資本五大關鍵要素。這五大維度的協同共振,不僅是云天勵飛應對行業激烈競爭的底氣,更為未來三年戰略的穩步落地提供了堅實的體系化保障。
針對行業普遍關注的供應鏈安全問題,云天勵飛高級副總裁、CFO 兼董秘鄧浩然特別強調,公司目前是國內屈指可數手握充足國產產能保障的企業之一,這一戰略儲備為后續芯片的大規模量產與交付提供了極高的確定性。
陳寧還詳細解讀了云天勵飛的“1+4”架構:“1”指聚焦于AI大算力推理芯片,“4”則是四大事業部。作為生態構建者,四大事業部旨在解決芯片從“研發生產、優化打磨到市場推廣”的核心難題。其中,政企事業部作為基石,將憑借深厚的行業經驗,將戰略重點轉向推理設備和智算中心的建設。此外,云天勵飛還計劃打造區域級“千卡集群”,樹立城市AI算力賦能的新標桿。
藍圖展開:DeepVerse 領銜,全場景算力矩陣精準卡位
面向未來三年的規劃,云天勵飛CTO李愛軍表示,將不遺余力投入大算力芯片DeepVerse的研發,圍繞推理成本、時延與吞吐的核心矛盾持續迭代,并按產品節奏梯度覆蓋市場需求。
路線圖將對標國際主流平臺的代際演進,聚焦長上下文預填充(Prefill)、低時延解碼(Decode)等關鍵推理階段的系統優化,在真實負載下持續兌現“更便宜、更穩定、更易部署”的交付目標。

推理時代的競爭,本質是“單位推理成本”的競爭。只有把推理做得足夠便宜、足夠穩定、足夠易用,AI 才能從“看得見的能力”走向“用得起的生產力”。
未來,云天勵飛將以 GPNPU 架構為核心,大力推進云端大算力強化軟硬協同與存儲體系攻堅,力爭將百萬 Tokens 推理成本降低 100 倍以上,推動大模型從示范應用走向規模化交付。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
發布評論請先 登錄
相關推薦
熱點推薦
曦望發布新一代推理GPU芯片,單位Token推理成本降低90%
已突破萬片。 ? 啟望S3是專為大模型推理打造的定制化GPGPU芯片。在典型推理場景下,它的整體性價比較上一代提升超10倍。在算
云天勵飛:AI推理需求狂飆,國產算力芯片機遇期加速到來
今年來自國內外的半導體創新領袖企業高管們又帶來哪些前瞻觀點?此次,電子發燒友網特別采訪了云天勵飛,以下是這家公司對2026年半導體產業的分析與展望。
算力積木+3D堆疊!GPNPU架構創新,應對AI推理需求
電子發燒友網報道(文/李彎彎)2025年,人工智能正式邁入應用推理時代。大模型從實驗室走向千行百業,推理需求呈指數級爆發。然而,高昂的推理成本
云天勵飛AI推理芯片如何賦能千行百業
11月26日,云天會客廳第二期生態沙龍暨深商聯高科技高成長創新營走進上市公司活動圓滿舉辦。來自深圳科技領域的多位企業負責人齊聚云天勵飛,共同探討AI
云天勵飛亮相2025中國國際半導體博覽會
2025年11月23日,第二十二屆中國國際半導體博覽會(IC China 2025)在北京國家會議中心啟幕。在24日舉辦的 “人工智能及大模型芯片論壇” 上,云天勵
《AI芯片:科技探索與AGI愿景》—— 勾勒計算未來的戰略羅盤
如果說算力是AGI的“燃料”,那么AI芯片就是制造燃料的“精煉廠”。本書的卓越之處在于,它超越了單純的技術拆解,成功繪制了一幅從專用智能邁向通用智能的“戰略
發表于 09-17 09:32
力爭百萬 Tokens 推理成本降低百倍:云天勵飛發布未來三年大算力芯片戰略,首曝 DeepVerse 路線圖
評論