電子發燒友網報道 1月27日,國產GPU廠商曦望(Sunrise)重磅發布新一代推理GPU芯片——啟望S3。這是曦望在近一年累計完成約30億元戰略融資后的首次集中公開亮相。2025年,曦望芯片交付量已突破萬片。
啟望S3是專為大模型推理打造的定制化GPGPU芯片。在典型推理場景下,它的整體性價比較上一代提升超10倍。在算力與存儲設計方面,該芯片支持FP16至FP4精度切換,采用LPDDR6顯存方案,顯存容量提升4倍,有效緩解了大模型推理的顯存瓶頸,成為國內首款采用此顯存方案的芯片。在DeepSeek V3/R1滿血版等主流大模型推理中,單位Token成本較上一代降低約90%,讓“百萬Token一分錢”成為可能,極大推動了大模型推理的大規模普惠應用。
曦望是國產全棧自研人工智能算力芯片企業,其前身是商湯大芯片部門,于2024年底分拆獨立運營。它專注于高性能GPU及多模態場景推理芯片的研發與商業化,憑借八年技術沉淀、二十億研發投入及兩代量產芯片的工程化驗證,已成為國產GPU替代的核心力量。公司致力于為千行百業提供成本降低十倍、能效比突破的智能算力基石,推動各行業智能化發展,助力實現通用人工智能(AGI)的普惠化目標。
曦望已構建起覆蓋全場景需求的三代芯片產品矩陣。2020年量產的首款AI推理芯片S1,適配千余種CV模型,滿足了視覺推理領域的需求。2024年量產的S2芯片,深度兼容CUDA生態,能流暢推理DeepSeek、Qwen等開源大模型,以及文生圖、文生視頻、文生3D主流模型,進一步拓展了應用場景。而此次推出的S3芯片,定位“推理性價比之王”,在單位Token成本、能耗表現上實現數量級突破,原生支持FP8/FP4低精度推理,為大模型推理提供核心支撐。
作為國內首家All - in推理的GPU芯片公司,曦望始終深耕推理賽道。在一年內,它順利完成了近30億元戰略融資,投資方陣容強大。既有三一集團旗下華胥基金、范式智能等產業投資方,也有無極資本、IDG資本等國內知名VC/PE機構,還獲得了誠通混改基金等國資背景資本的鼎力加持。所籌資金將專項用于下一代推理GPU的核心技術研發、規模化量產及生態共建,持續夯實其在推理算力賽道的核心競爭力。
此次發布,曦望不僅帶來了啟望S3芯片,還推出了一整套面向大模型推理的解決方案。寰望SC3 - 256超節點方案,面向千億、萬億級參數多模態MoE推理,采用全液冷設計,支持大規模專家并行部署,同等算力規模下,整體交付成本從“億元級”降至“千萬元級”。“百萬Token一分錢”計劃,聯合商湯科技等伙伴共同發起,大幅降低企業使用算力的門檻。共建推理云通過GPU池化與彈性調度,將算力整合為統一“算力池”,以MaaS為核心入口,讓企業按需調用算力。
當前,AI模型訓練已邁入深水區,推理環節成為AI技術商業化落地的關鍵。曦望以啟望S3芯片為核心,通過“芯片 + 系統 + 生態”的布局,讓推理算力變得更像水電一樣,成為可規模化、可持續的基礎設施,引領國產GPU邁向新的高度。
啟望S3是專為大模型推理打造的定制化GPGPU芯片。在典型推理場景下,它的整體性價比較上一代提升超10倍。在算力與存儲設計方面,該芯片支持FP16至FP4精度切換,采用LPDDR6顯存方案,顯存容量提升4倍,有效緩解了大模型推理的顯存瓶頸,成為國內首款采用此顯存方案的芯片。在DeepSeek V3/R1滿血版等主流大模型推理中,單位Token成本較上一代降低約90%,讓“百萬Token一分錢”成為可能,極大推動了大模型推理的大規模普惠應用。
曦望是國產全棧自研人工智能算力芯片企業,其前身是商湯大芯片部門,于2024年底分拆獨立運營。它專注于高性能GPU及多模態場景推理芯片的研發與商業化,憑借八年技術沉淀、二十億研發投入及兩代量產芯片的工程化驗證,已成為國產GPU替代的核心力量。公司致力于為千行百業提供成本降低十倍、能效比突破的智能算力基石,推動各行業智能化發展,助力實現通用人工智能(AGI)的普惠化目標。
曦望已構建起覆蓋全場景需求的三代芯片產品矩陣。2020年量產的首款AI推理芯片S1,適配千余種CV模型,滿足了視覺推理領域的需求。2024年量產的S2芯片,深度兼容CUDA生態,能流暢推理DeepSeek、Qwen等開源大模型,以及文生圖、文生視頻、文生3D主流模型,進一步拓展了應用場景。而此次推出的S3芯片,定位“推理性價比之王”,在單位Token成本、能耗表現上實現數量級突破,原生支持FP8/FP4低精度推理,為大模型推理提供核心支撐。
作為國內首家All - in推理的GPU芯片公司,曦望始終深耕推理賽道。在一年內,它順利完成了近30億元戰略融資,投資方陣容強大。既有三一集團旗下華胥基金、范式智能等產業投資方,也有無極資本、IDG資本等國內知名VC/PE機構,還獲得了誠通混改基金等國資背景資本的鼎力加持。所籌資金將專項用于下一代推理GPU的核心技術研發、規模化量產及生態共建,持續夯實其在推理算力賽道的核心競爭力。
此次發布,曦望不僅帶來了啟望S3芯片,還推出了一整套面向大模型推理的解決方案。寰望SC3 - 256超節點方案,面向千億、萬億級參數多模態MoE推理,采用全液冷設計,支持大規模專家并行部署,同等算力規模下,整體交付成本從“億元級”降至“千萬元級”。“百萬Token一分錢”計劃,聯合商湯科技等伙伴共同發起,大幅降低企業使用算力的門檻。共建推理云通過GPU池化與彈性調度,將算力整合為統一“算力池”,以MaaS為核心入口,讓企業按需調用算力。
當前,AI模型訓練已邁入深水區,推理環節成為AI技術商業化落地的關鍵。曦望以啟望S3芯片為核心,通過“芯片 + 系統 + 生態”的布局,讓推理算力變得更像水電一樣,成為可規模化、可持續的基礎設施,引領國產GPU邁向新的高度。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
gpu
+關注
關注
28文章
5194瀏覽量
135422
發布評論請先 登錄
相關推薦
熱點推薦
曦云C系列GPU Day 0 適配智譜全新一代大模型GLM-5
智譜AI正式上線并開源全新一代大模型 GLM-5,沐曦股份實現?Day 0 深度適配。 GLM-5目前可于曦云 C 系列(C500/C550/C588)上穩定高效運行。 近期,智譜AI相繼發布
百億Token一分錢!云天勵飛喊出“推理成本萬倍降”,公布三年三芯路線圖
電子發燒友網報道(文/莫婷婷)當前,全球人工智能邁入具身智能(Agentic AI)時代,云天勵飛董事長兼CEO陳寧博士在“大算力芯片戰略前瞻會”上再次強調:公司將聚焦大模型推理芯片。在大會上,云天
力爭百萬 Tokens 推理成本降低百倍:云天勵飛發布未來三年大算力芯片戰略,首曝 DeepVerse 路線圖
集中于攻克大模型落地的“成本壁壘”,致力于通過底層架構創新,力爭實現百萬 Tokens 推理成本降低 100 倍以上的目標,推動 AI 從技術嘗鮮走向普惠生產力。產業變局:推理競速,從
云巨頭算力戰升級!微軟新一代3nm AI推理芯片性能提升30%,落地數據中心
據外媒報道,微軟發布新一代人工智能芯片Maia 200,這款芯片有望成為英偉達旗艦處理器以及云服務競爭對手亞馬遜、谷歌同類產品的替代選擇。微軟稱,這款
華為數據存儲與「DaoCloud 道客」發布AI推理加速聯合解決方案
規模化發展的攔路虎。在有限算力下,長序列輸入導致首Token時延(TTFT)增加,甚至超長序列超出模型上下文窗口限制;隨著并發數增加,推理吞吐開始下降,任務頻繁卡頓;歷史對話和行業知識的重復調用造成算力浪費,加大推理成本。如何優
首款全國產通用GPU芯片發布 沐曦集成推出曦云C600
,并支持MetaXLink超節點擴展技術,在硬件性能和軟件兼容上完全滿足下一代生成式AI的訓練和推理需求。 而且,沐曦股份與中國科學院合作的國產千卡集群,已完成多個大模型全參數訓練,證實國產算力已具備大模型預訓練能力。 公開資料
今日看點丨華為發布AI推理創新技術UCM;比亞迪汽車出口暴增130%
緩存加速算法工具,分級管理推理過程中產生的KV Cache記憶數據,可擴大推理上下文窗口,實現高吞吐、低時延的推理體驗,降低每Token
發表于 08-13 09:45
?5287次閱讀
今日看點丨兩家國產頭部廠商發布新一代AI芯片 ;臺積電在美先進封裝布局啟動
? ? H20重返中國在即,兩家國產頭部廠商發布新一代AI芯片 ? 日前,燧原科技和沐曦這兩家頭部國產AI芯片廠商首發各自
發表于 07-28 10:41
?2466次閱讀
信而泰×DeepSeek:AI推理引擎驅動網絡智能診斷邁向 “自愈”時代
DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎技術研究有限公司開發的新一代AI大模型。其核心優勢在于強大的推理引擎能力,融合了自然語言處理(NLP)、深度
發表于 07-16 15:29
谷歌新一代 TPU 芯片 Ironwood:助力大規模思考與推理的 AI 模型新引擎?
電子發燒友網報道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據悉,該芯片預計于今年晚些時候面向 Google
沐曦加速DeepSeek滿血版單卡C500異構推理
近日,基于開源KTransformers架構的 CPU/GPU 異構推理能力,沐曦在曦云C500單卡GPU上成功實現DeepSeek-R1-
英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型
Triton 推理服務器的后續產品,NVIDIA Dynamo 是一款全新的 AI 推理服務軟件,旨在為部署推理 AI 模型的 AI 工廠最大化其
曦望發布新一代推理GPU芯片,單位Token推理成本降低90%
評論