電子發燒友網報道(文/莫婷婷)當前,全球人工智能邁入具身智能(Agentic AI)時代,云天勵飛董事長兼CEO陳寧博士在“大算力芯片戰略前瞻會”上強調:公司將聚焦大模型推理芯片。在大會上,云天勵飛闡述了GPNPU架構的技術內涵,并公開了未來三年大算力芯片路線圖,致力于成為“最懂AI的推理芯片領軍企業”。

GPNPU:打造中國版TPU的最優解
自2025年起,AI推理芯片將迎來未來5至10年的高光時刻,核心驅動力在于大模型推理需求的爆發式增長——尤其是Token數量的指數級攀升。
以字節跳動的豆包為例:2024年5日均Token量僅為0.12萬億;到2025年9月,已飆升至30萬億;僅三個月后(2025年12月)便突破50萬億。按此每季度近翻倍的增速推算,當前日均Token量很可能已達70–80萬億。

大模型訓練與推理在計算范式上的根本差異:訓練追求算力絕對值、高精度和大規模集群互聯,而推理則聚焦成本敏感、能效比與極致性價比。訓練芯片需要百萬卡級的高性能互聯,依賴FP64/32/16等高精度計算,對成本不敏感;而推理場景——如手機上的豆包、耳機中的同聲傳譯、眼鏡里的智能助手——更關注每個Token背后的真實成本。
陳寧博士表示,云天勵飛將持續推進“百萬Token推理成本每年兩位數下降”的目標,力爭到2030年實現“百億Token僅需一分錢人民幣”,最終達成“推理算力平權”。
面對全球AI算力重心從訓練向推理遷移的歷史性拐點,云天勵飛指出“訓練追趕、推理超車”是公司未來五年的核心策略。2025年,云天勵飛提出其第五代芯片架構——GPNPU。
陳寧博士表示,GPNPU架構是大模型推理的最佳載體。
GPNPU是一套覆蓋硬件微架構、系統集成和軟件生態的綜合解決方案,其本質是“GPGPU + NPU + 3DM + 算力積木”四維融合,具備了通用性、高效性、大帶寬、低延時等特點,且采用了算力積木架構。
云天勵飛CTO李愛軍進一步介紹,GPNPU實現對CUDA兼容,支持“一行代碼遷移”;采用NPU級SIMD矩陣計算單元,實現單位面積更高的計算密度;該架構引入自研3D Memory堆疊架構,帶寬達HBM的10倍,有效破解“內存墻”瓶頸;通過3DM高效訪存架構實現10納秒級延遲,滿足實時交互類應用需求。
值得一提的是,云天勵飛在過去五年深耕國產工藝,率先探索了 Chiplet算力積木架構,而這一架構與當前大模型推理所需的超節點設計理念異曲同工。為此,公司定義下一代芯片的Scale-Up超節點架構,從而高效支撐萬億級乃至十萬億級MoE大模型的推理需求。云天勵飛也是國內少數掌握D2D Chiplet和C2C Mesh互連技術的企業之一。

李愛軍提到,GPNPU系統級芯片,相比當前主流以訓練為主的GPGPU架構,在推理效率、性能表現和成本控制方面均實現了顯著領先。更進一步的在Agent 時代,多模型、多智能體的自主多模型的推理時代,對于推理的時延到了毫秒級,這個時候我們的領先優勢將會實現跨代的領先。
公布三年三芯路線圖
在發布會上,云天勵飛公布了未來三年大算力芯片規劃,以“PD分離 + AFN細粒度優化 + 超節點集群”為核心設計理念,精準應對大模型推理中prefill(計算密集)與decode(訪存密集)階段的不同需求。
2025年:推出第一代超節點P芯片(DeepVerse 100),專注百萬長上下文場景的prefill推理,算力對標英偉達Hopper架構的H100;
2026年:發布第一代超節點D芯片(DeepVerse 200),聚焦超低延遲decode推理,性能看齊Blackwell架構的B200;
2027年:迭代至第二代超節點P芯片(DeepVerse 300),實現毫秒級端到端推理時延,算力目標直指英偉達下一代Rubin架構。

云天勵飛以大模型推理為核心應用場景,覆蓋大模型云推理、多模態理解等當前主流。云天勵飛透露,公司的產業也可以應用到深空探測領域,推進“算力進太空”,開啟AI航天新篇章。
目前,云天勵飛已構建多元化的生態布局,其客戶群體包括AI大模型企業、涵蓋互聯網大廠、科技領軍企業等行業頭部客戶,以及政企與基礎設施客戶。
可以看到,云天勵飛不僅擁有領先的技術,還具備強大的供應鏈韌性與交付能力。尤為值得關注的是,云天勵飛已成功實現全國產化工藝閉環。僅用五年時間,公司完成了從芯片設計、先進制造工藝到先進封裝的全鏈條自主可控,并推動全國產推理算力芯片持續迭代。
至今,云天勵飛已構建“1+4”組織架構,包括:
政企事業部:作為公司基石,聚焦智慧城市、交通、安防等領域,正在規劃建設區域級千卡智算集群,賦能城市級AI滲透;
嚕咔(Luka)事業部:打造面向兒童的AI原生硬件智能體,被內部稱為“Token吞金獸”,有望成為消費級爆品;
岍丞(Qiancheng)事業部:藍牙耳機模組年出貨超3200萬顆,占中國手機品牌35%以上份額,2026年將啟動自有AI C端品牌探索;
智算事業部:服務互聯網大廠與運營商,已斬獲16億大單,正與多家頭部客戶推進深度合作。
這四大事業部,讓云天勵飛形成從技術研發到市場落地的完整閉環。
小結:
站在第四次工業革命的門檻上,云天勵飛正以GPNPU為支點,撬動中國在全球AI基礎設施格局中的新地位。在發布會上,云天勵飛強調,“到2030年,通過GPNPU推理架構的持續創新,堅定推進百萬Tokens推理成本萬倍降低,最終實現推理算力平權!”

GPNPU:打造中國版TPU的最優解
自2025年起,AI推理芯片將迎來未來5至10年的高光時刻,核心驅動力在于大模型推理需求的爆發式增長——尤其是Token數量的指數級攀升。
以字節跳動的豆包為例:2024年5日均Token量僅為0.12萬億;到2025年9月,已飆升至30萬億;僅三個月后(2025年12月)便突破50萬億。按此每季度近翻倍的增速推算,當前日均Token量很可能已達70–80萬億。

大模型訓練與推理在計算范式上的根本差異:訓練追求算力絕對值、高精度和大規模集群互聯,而推理則聚焦成本敏感、能效比與極致性價比。訓練芯片需要百萬卡級的高性能互聯,依賴FP64/32/16等高精度計算,對成本不敏感;而推理場景——如手機上的豆包、耳機中的同聲傳譯、眼鏡里的智能助手——更關注每個Token背后的真實成本。
陳寧博士表示,云天勵飛將持續推進“百萬Token推理成本每年兩位數下降”的目標,力爭到2030年實現“百億Token僅需一分錢人民幣”,最終達成“推理算力平權”。
面對全球AI算力重心從訓練向推理遷移的歷史性拐點,云天勵飛指出“訓練追趕、推理超車”是公司未來五年的核心策略。2025年,云天勵飛提出其第五代芯片架構——GPNPU。
陳寧博士表示,GPNPU架構是大模型推理的最佳載體。
GPNPU是一套覆蓋硬件微架構、系統集成和軟件生態的綜合解決方案,其本質是“GPGPU + NPU + 3DM + 算力積木”四維融合,具備了通用性、高效性、大帶寬、低延時等特點,且采用了算力積木架構。
云天勵飛CTO李愛軍進一步介紹,GPNPU實現對CUDA兼容,支持“一行代碼遷移”;采用NPU級SIMD矩陣計算單元,實現單位面積更高的計算密度;該架構引入自研3D Memory堆疊架構,帶寬達HBM的10倍,有效破解“內存墻”瓶頸;通過3DM高效訪存架構實現10納秒級延遲,滿足實時交互類應用需求。
值得一提的是,云天勵飛在過去五年深耕國產工藝,率先探索了 Chiplet算力積木架構,而這一架構與當前大模型推理所需的超節點設計理念異曲同工。為此,公司定義下一代芯片的Scale-Up超節點架構,從而高效支撐萬億級乃至十萬億級MoE大模型的推理需求。云天勵飛也是國內少數掌握D2D Chiplet和C2C Mesh互連技術的企業之一。

李愛軍提到,GPNPU系統級芯片,相比當前主流以訓練為主的GPGPU架構,在推理效率、性能表現和成本控制方面均實現了顯著領先。更進一步的在Agent 時代,多模型、多智能體的自主多模型的推理時代,對于推理的時延到了毫秒級,這個時候我們的領先優勢將會實現跨代的領先。
公布三年三芯路線圖
在發布會上,云天勵飛公布了未來三年大算力芯片規劃,以“PD分離 + AFN細粒度優化 + 超節點集群”為核心設計理念,精準應對大模型推理中prefill(計算密集)與decode(訪存密集)階段的不同需求。
2025年:推出第一代超節點P芯片(DeepVerse 100),專注百萬長上下文場景的prefill推理,算力對標英偉達Hopper架構的H100;
2026年:發布第一代超節點D芯片(DeepVerse 200),聚焦超低延遲decode推理,性能看齊Blackwell架構的B200;
2027年:迭代至第二代超節點P芯片(DeepVerse 300),實現毫秒級端到端推理時延,算力目標直指英偉達下一代Rubin架構。

云天勵飛以大模型推理為核心應用場景,覆蓋大模型云推理、多模態理解等當前主流。云天勵飛透露,公司的產業也可以應用到深空探測領域,推進“算力進太空”,開啟AI航天新篇章。
目前,云天勵飛已構建多元化的生態布局,其客戶群體包括AI大模型企業、涵蓋互聯網大廠、科技領軍企業等行業頭部客戶,以及政企與基礎設施客戶。
可以看到,云天勵飛不僅擁有領先的技術,還具備強大的供應鏈韌性與交付能力。尤為值得關注的是,云天勵飛已成功實現全國產化工藝閉環。僅用五年時間,公司完成了從芯片設計、先進制造工藝到先進封裝的全鏈條自主可控,并推動全國產推理算力芯片持續迭代。
至今,云天勵飛已構建“1+4”組織架構,包括:
政企事業部:作為公司基石,聚焦智慧城市、交通、安防等領域,正在規劃建設區域級千卡智算集群,賦能城市級AI滲透;
嚕咔(Luka)事業部:打造面向兒童的AI原生硬件智能體,被內部稱為“Token吞金獸”,有望成為消費級爆品;
岍丞(Qiancheng)事業部:藍牙耳機模組年出貨超3200萬顆,占中國手機品牌35%以上份額,2026年將啟動自有AI C端品牌探索;
智算事業部:服務互聯網大廠與運營商,已斬獲16億大單,正與多家頭部客戶推進深度合作。
這四大事業部,讓云天勵飛形成從技術研發到市場落地的完整閉環。
小結:
站在第四次工業革命的門檻上,云天勵飛正以GPNPU為支點,撬動中國在全球AI基礎設施格局中的新地位。在發布會上,云天勵飛強調,“到2030年,通過GPNPU推理架構的持續創新,堅定推進百萬Tokens推理成本萬倍降低,最終實現推理算力平權!”
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
AI
+關注
關注
91文章
40661瀏覽量
302318 -
云天勵飛
+關注
關注
0文章
184瀏覽量
12692
發布評論請先 登錄
相關推薦
熱點推薦
全球唯一?IBM更新量子計算路線圖:2029年交付!
電子發燒友網報道(文/梁浩斌)近年來,量子計算似乎正在取得越來越多突破,國內外都涌現出不少的技術以及產品突破。作為量子計算領域的先驅之一,IBM近日公布了其量子計算路線圖,宣布將在2029年
國內首個國產AI推理千卡集群落地,采用云天勵飛全自研AI推理芯片
3 月 12 日,云天勵飛中標湛江市AI滲透支撐新質生產力基礎設施建設項目,中標金額4.2億元。項目將基于云天勵
發表于 03-12 11:10
?1282次閱讀
力爭百萬 Tokens 推理成本降低百倍:云天勵飛發布未來三年大算力芯片戰略,首曝 DeepVerse 路線圖
2月3日,云天勵飛正式舉辦“大算力芯片戰略前瞻會”,首次對外公布未來三年的大算力 AI 推理芯片
曦望發布新一代推理GPU芯片,單位Token推理成本降低90%
已突破萬片。 ? 啟望S3是專為大模型推理打造的定制化GPGPU芯片。在典型推理場景下,它的整體性價比較上一代提升超10倍。在算力與存儲設計
云天勵飛:AI推理需求狂飆,國產算力芯片機遇期加速到來
今年來自國內外的半導體創新領袖企業高管們又帶來哪些前瞻觀點?此次,電子發燒友網特別采訪了云天勵飛,以下是這家公司對2026年半導體產業的分析與展望。
云天勵飛中標AI龍崗一期1.22億元項目
日前,云天勵飛中標AI龍崗一期1.22億元項目,將為龍崗區打造AI與機器人示范場景提供技術支撐,助力城市治理智能化水平持續提升。
云天勵飛AI推理芯片如何賦能千行百業
11月26日,云天會客廳第二期生態沙龍暨深商聯高科技高成長創新營走進上市公司活動圓滿舉辦。來自深圳科技領域的多位企業負責人齊聚云天勵飛,共同探討AI
云天勵飛亮相2025中國具身智能機器人大會
近日,在 2025 中國具身智能機器人大會上,云天勵飛副總裁羅憶從芯片廠商的視角出發,對具身智能產業的未來進行了深入剖析,并分享了公司在 AI 推理芯片與機器人應用場景方面的整體布局。
云天勵飛亮相2025灣區半導體產業生態博覽會
在2025灣區半導體產業生態博覽會(灣芯展)上,云天勵飛以“算力積木”為核心理念,攜全棧AI推理產品體系重磅亮相,集中展示了從芯片到模組再到
華為首次公布昇騰芯片新路線圖
9月18日在上海世博中心舉辦的 2025 華為全聯接大會上,華為副董事長、輪值董事長徐直軍登臺發表演講,首次對外公布了昇騰 AI 芯片未來三年的產品迭代路線圖。這一消息無疑為國內 AI
百億Token一分錢!云天勵飛喊出“推理成本萬倍降”,公布三年三芯路線圖
評論