无码人妻久久久久一区二区三区91,国产一区二区2025,久久影库电影精品

電子發燒友網報道 1月27日，國產GPU廠商曦望（Sunrise）重磅發布新一代推理GPU芯片——啟望S3。這是曦望在近一年累計完成約30億元戰略融資后的首次集中公開亮相。2025年，曦望芯片交付量已突破萬片。

啟望S3是專為大模型推理打造的定制化GPGPU芯片。在典型推理場景下，它的整體性價比較上一代提升超10倍。在算力與存儲設計方面，該芯片支持FP16至FP4精度切換，采用LPDDR6顯存方案，顯存容量提升4倍，有效緩解了大模型推理的顯存瓶頸，成為國內首款采用此顯存方案的芯片。在DeepSeek V3/R1滿血版等主流大模型推理中，單位Token成本較上一代降低約90%，讓“百萬Token一分錢”成為可能，極大推動了大模型推理的大規模普惠應用。

曦望是國產全棧自研人工智能算力芯片企業，其前身是商湯大芯片部門，于2024年底分拆獨立運營。它專注于高性能GPU及多模態場景推理芯片的研發與商業化，憑借八年技術沉淀、二十億研發投入及兩代量產芯片的工程化驗證，已成為國產GPU替代的核心力量。公司致力于為千行百業提供成本降低十倍、能效比突破的智能算力基石，推動各行業智能化發展，助力實現通用人工智能（AGI）的普惠化目標。

曦望已構建起覆蓋全場景需求的三代芯片產品矩陣。2020年量產的首款AI推理芯片S1，適配千余種CV模型，滿足了視覺推理領域的需求。2024年量產的S2芯片，深度兼容CUDA生態，能流暢推理DeepSeek、Qwen等開源大模型，以及文生圖、文生視頻、文生3D主流模型，進一步拓展了應用場景。而此次推出的S3芯片，定位“推理性價比之王”，在單位Token成本、能耗表現上實現數量級突破，原生支持FP8/FP4低精度推理，為大模型推理提供核心支撐。

作為國內首家All - in推理的GPU芯片公司，曦望始終深耕推理賽道。在一年內，它順利完成了近30億元戰略融資，投資方陣容強大。既有三一集團旗下華胥基金、范式智能等產業投資方，也有無極資本、IDG資本等國內知名VC/PE機構，還獲得了誠通混改基金等國資背景資本的鼎力加持。所籌資金將專項用于下一代推理GPU的核心技術研發、規模化量產及生態共建，持續夯實其在推理算力賽道的核心競爭力。

此次發布，曦望不僅帶來了啟望S3芯片，還推出了一整套面向大模型推理的解決方案。寰望SC3 - 256超節點方案，面向千億、萬億級參數多模態MoE推理，采用全液冷設計，支持大規模專家并行部署，同等算力規模下，整體交付成本從“億元級”降至“千萬元級”。“百萬Token一分錢”計劃，聯合商湯科技等伙伴共同發起，大幅降低企業使用算力的門檻。共建推理云通過GPU池化與彈性調度，將算力整合為統一“算力池”，以MaaS為核心入口，讓企業按需調用算力。

當前，AI模型訓練已邁入深水區，推理環節成為AI技術商業化落地的關鍵。曦望以啟望S3芯片為核心，通過“芯片 + 系統 + 生態”的布局，讓推理算力變得更像水電一樣，成為可規模化、可持續的基礎設施，引領國產GPU邁向新的高度。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

gpu

gpu

+關注

關注
28

文章
5194

瀏覽量
135422

搜索歷史

曦望發布新一代推理GPU芯片，單位Token推理成本降低90%

評論