国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

曦望發布新一代推理GPU芯片,單位Token推理成本降低90%

Carol Li ? 來源:電子發燒友網 ? 作者:李彎彎 ? 2026-01-28 17:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發燒友網報道 1月27日,國產GPU廠商曦望(Sunrise)重磅發布新一代推理GPU芯片——啟望S3。這是曦望在近一年累計完成約30億元戰略融資后的首次集中公開亮相。2025年,曦望芯片交付量已突破萬片。

啟望S3是專為大模型推理打造的定制化GPGPU芯片。在典型推理場景下,它的整體性價比較上一代提升超10倍。在算力與存儲設計方面,該芯片支持FP16至FP4精度切換,采用LPDDR6顯存方案,顯存容量提升4倍,有效緩解了大模型推理的顯存瓶頸,成為國內首款采用此顯存方案的芯片。在DeepSeek V3/R1滿血版等主流大模型推理中,單位Token成本較上一代降低約90%,讓“百萬Token一分錢”成為可能,極大推動了大模型推理的大規模普惠應用。

曦望是國產全棧自研人工智能算力芯片企業,其前身是商湯大芯片部門,于2024年底分拆獨立運營。它專注于高性能GPU及多模態場景推理芯片的研發與商業化,憑借八年技術沉淀、二十億研發投入及兩代量產芯片的工程化驗證,已成為國產GPU替代的核心力量。公司致力于為千行百業提供成本降低十倍、能效比突破的智能算力基石,推動各行業智能化發展,助力實現通用人工智能(AGI)的普惠化目標。

曦望已構建起覆蓋全場景需求的三代芯片產品矩陣。2020年量產的首款AI推理芯片S1,適配千余種CV模型,滿足了視覺推理領域的需求。2024年量產的S2芯片,深度兼容CUDA生態,能流暢推理DeepSeek、Qwen等開源大模型,以及文生圖、文生視頻、文生3D主流模型,進一步拓展了應用場景。而此次推出的S3芯片,定位“推理性價比之王”,在單位Token成本、能耗表現上實現數量級突破,原生支持FP8/FP4低精度推理,為大模型推理提供核心支撐。

作為國內首家All - in推理的GPU芯片公司,曦望始終深耕推理賽道。在一年內,它順利完成了近30億元戰略融資,投資方陣容強大。既有三一集團旗下華胥基金、范式智能等產業投資方,也有無極資本、IDG資本等國內知名VC/PE機構,還獲得了誠通混改基金等國資背景資本的鼎力加持。所籌資金將專項用于下一代推理GPU的核心技術研發、規模化量產及生態共建,持續夯實其在推理算力賽道的核心競爭力。

此次發布,曦望不僅帶來了啟望S3芯片,還推出了一整套面向大模型推理的解決方案。寰望SC3 - 256超節點方案,面向千億、萬億級參數多模態MoE推理,采用全液冷設計,支持大規模專家并行部署,同等算力規模下,整體交付成本從“億元級”降至“千萬元級”。“百萬Token一分錢”計劃,聯合商湯科技等伙伴共同發起,大幅降低企業使用算力的門檻。共建推理云通過GPU池化與彈性調度,將算力整合為統一“算力池”,以MaaS為核心入口,讓企業按需調用算力。

當前,AI模型訓練已邁入深水區,推理環節成為AI技術商業化落地的關鍵。曦望以啟望S3芯片為核心,通過“芯片 + 系統 + 生態”的布局,讓推理算力變得更像水電一樣,成為可規模化、可持續的基礎設施,引領國產GPU邁向新的高度。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135422
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    堪稱史上最強推理芯片!英偉達發布 Rubin CPX,實現50倍ROI

    款AI芯片,Rubin CPX采用了成本效益極高的單芯片設計,集成強大的NVFP4計算資源,其GPU專為AI
    的頭像 發表于 09-11 08:25 ?1.1w次閱讀
    堪稱史上最強<b class='flag-5'>推理</b><b class='flag-5'>芯片</b>!英偉達<b class='flag-5'>發布</b> Rubin CPX,實現50倍ROI

    云C系列GPU Day 0 適配智譜全新一代大模型GLM-5

    智譜AI正式上線并開源全新一代大模型 GLM-5,沐股份實現?Day 0 深度適配。 GLM-5目前可于云 C 系列(C500/C550/C588)上穩定高效運行。 近期,智譜AI相繼發布
    的頭像 發表于 02-12 10:53 ?792次閱讀
    <b class='flag-5'>曦</b>云C系列<b class='flag-5'>GPU</b> Day 0 適配智譜全<b class='flag-5'>新一代</b>大模型GLM-5

    百億Token分錢!云天勵飛喊出“推理成本萬倍降”,公布三年三芯路線圖

    電子發燒友網報道(文/莫婷婷)當前,全球人工智能邁入具身智能(Agentic AI)時代,云天勵飛董事長兼CEO陳寧博士在“大算力芯片戰略前瞻會”上再次強調:公司將聚焦大模型推理芯片。在大會上,云天
    的頭像 發表于 02-09 14:54 ?4296次閱讀
    百億<b class='flag-5'>Token</b><b class='flag-5'>一</b>分錢!云天勵飛喊出“<b class='flag-5'>推理成本</b>萬倍降”,公布三年三芯路線圖

    力爭百萬 Tokens 推理成本降低百倍:云天勵飛發布未來三年大算力芯片戰略,首曝 DeepVerse 路線圖

    集中于攻克大模型落地的“成本壁壘”,致力于通過底層架構創新,力爭實現百萬 Tokens 推理成本降低 100 倍以上的目標,推動 AI 從技術嘗鮮走向普惠生產力。產業變局:推理競速,從
    的頭像 發表于 02-03 20:25 ?1939次閱讀
    力爭百萬 Tokens <b class='flag-5'>推理成本</b><b class='flag-5'>降低</b>百倍:云天勵飛<b class='flag-5'>發布</b>未來三年大算力<b class='flag-5'>芯片</b>戰略,首曝 DeepVerse 路線圖

    今日看點:消息稱 AMD、高通考慮導入 SOCAMM 內存;發布新一代推理GPU芯片S3

    發布新一代推理GPU芯片
    發表于 01-28 11:09 ?374次閱讀

    云巨頭算力戰升級!微軟新一代3nm AI推理芯片性能提升30%,落地數據中心

    據外媒報道,微軟發布新一代人工智能芯片Maia 200,這款芯片有望成為英偉達旗艦處理器以及云服務競爭對手亞馬遜、谷歌同類產品的替代選擇。微軟稱,這款
    的頭像 發表于 01-27 12:29 ?4839次閱讀
    云巨頭算力戰升級!微軟<b class='flag-5'>新一代</b>3nm AI<b class='flag-5'>推理</b><b class='flag-5'>芯片</b>性能提升30%,落地數據中心

    華為數據存儲與「DaoCloud 道客」發布AI推理加速聯合解決方案

    規模化發展的攔路虎。在有限算力下,長序列輸入導致首Token時延(TTFT)增加,甚至超長序列超出模型上下文窗口限制;隨著并發數增加,推理吞吐開始下降,任務頻繁卡頓;歷史對話和行業知識的重復調用造成算力浪費,加大推理成本。如何優
    的頭像 發表于 11-28 10:03 ?397次閱讀
    華為數據存儲與「DaoCloud 道客」<b class='flag-5'>發布</b>AI<b class='flag-5'>推理</b>加速聯合解決方案

    首款全國產通用GPU芯片發布集成推出云C600

    ,并支持MetaXLink超節點擴展技術,在硬件性能和軟件兼容上完全滿足下一代生成式AI的訓練和推理需求。 而且,沐股份與中國科學院合作的國產千卡集群,已完成多個大模型全參數訓練,證實國產算力已具備大模型預訓練能力。 公開資料
    的頭像 發表于 10-19 20:04 ?4.6w次閱讀

    今日看點丨華為發布AI推理創新技術UCM;比亞迪汽車出口暴增130%

    緩存加速算法工具,分級管理推理過程中產生的KV Cache記憶數據,可擴大推理上下文窗口,實現高吞吐、低時延的推理體驗,降低Token
    發表于 08-13 09:45 ?5287次閱讀

    今日看點丨兩家國產頭部廠商發布新一代AI芯片 ;臺積電在美先進封裝布局啟動

    ? ? H20重返中國在即,兩家國產頭部廠商發布新一代AI芯片 ? 日前,燧原科技和沐這兩家頭部國產AI芯片廠商首發各自
    發表于 07-28 10:41 ?2466次閱讀
    今日看點丨兩家國產頭部廠商<b class='flag-5'>發布</b><b class='flag-5'>新一代</b>AI<b class='flag-5'>芯片</b> ;臺積電在美先進封裝布局啟動

    信而泰×DeepSeek:AI推理引擎驅動網絡智能診斷邁向 “自愈”時代

    DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎技術研究有限公司開發的新一代AI大模型。其核心優勢在于強大的推理引擎能力,融合了自然語言處理(NLP)、深度
    發表于 07-16 15:29

    谷歌新一代 TPU 芯片 Ironwood:助力大規模思考與推理的 AI 模型新引擎?

    電子發燒友網報道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據悉,該芯片預計于今年晚些時候面向 Google
    的頭像 發表于 04-12 00:57 ?3708次閱讀

    加速DeepSeek滿血版單卡C500異構推理

    近日,基于開源KTransformers架構的 CPU/GPU 異構推理能力,沐云C500單卡GPU上成功實現DeepSeek-R1-
    的頭像 發表于 03-20 15:52 ?2233次閱讀

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    Triton 推理服務器的后續產品,NVIDIA Dynamo 是款全新的 AI 推理服務軟件,旨在為部署推理 AI 模型的 AI 工廠最大化其
    的頭像 發表于 03-20 15:03 ?1231次閱讀

    無法調用GPU插件推理的遠程張量API怎么解決?

    運行了使用 GPU 插件的遠程張量 API 的推理。但是,它未能共享 OpenCL* 內存,但結果不正確。
    發表于 03-06 06:13