伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI推理需求爆發!高通首秀重磅產品,國產GPU的自主牌怎么打?

章鷹觀察 ? 來源:電子發燒友原創 ? 作者:章鷹 ? 2025-10-30 00:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(電子發燒友網報道 文/章鷹)近日,Omdia半導體研究團隊高級顧問宋卓在2025年灣芯展論壇上表示,該研究團隊對2025年全球及國內半導體市場保持樂觀,受到AI云服務相關硬件的持續投入推動影響,2025年全球半導體市場收入將達到7815億美元,預計同比2024年增長16.3%。

云天勵飛副總裁羅憶看好AI推理需求的增長,他指出國內AI面臨兩大拐點:1、算力需求爆發,大模型推理算力需求將在2026年超越訓練需求,成為算力消耗的主題,占據所有算力需求的比例將超過70%。2、國產算力芯片的使用比例不久將會超過海外芯片,目前兩者達到五五分。

圖1:AI推理需求爆發

10月29日,在安博會的2025智能算力應用及產業發展論壇上,超聚變數字技術有限公司深圳解決方案總監丁元釗表示,原來我們預計2026年是AI推理爆發元年,2025年DeepSeek-R1,V3模型推出,直接推動AI推理市場的上揚,未來3-5年都是AI推理領域的規模應用階段。不管是行業應用,還是算力相關的芯片,都將大規模的圍繞AI推理來爆發。

AI推理火爆主要的驅動力是什么?高通最新AI推理芯片,還有國內AI推理芯片領域,沐曦科技、云天勵飛、百度昆侖芯片的最新進展如何?本文將詳細匯總和分析。

AI推理火爆背后驅動力:邊緣AI需求暴增,Token調用量攀升,成本可控成新趨勢

2025年以來,隨著大模型(如DeepSeek、ChatGPT等)在醫療、金融、政務、消費電子等場景廣泛部署,AI工作負載正從“訓練”轉向“推理”。2025年,全球推理任務占比預計達67%,2028年將提升至73%。

2025年被視為“AI Agent元年”,智能體從被動執行轉向自主規劃與決策,單次任務消耗的Token量是傳統對話的100倍以上。大模型普及正驅動全球日均Token調用量飛速攀升,據統計,全球AI巨頭月消耗token量已經來到千萬億量級,且仍在持續提升。Token調用量的攀升直接帶動了推理算力需求的指數級增長。據麥肯錫預測,全球AI推理市場將于2028年達到1500億美元,年復合增長率達40%,遠高于訓練市場的20%。

云天勵飛副總裁羅憶指出,Token數可能每年增長10倍,但是算力基礎設施投入上,基本是一倍增加,如何彌補中間的鴻溝?這就意味著需要更少的算力解決更多Token的推理。

高通發布兩款AI芯片,進軍數據中心AI推理市場

10月27日晚間,美國移動芯片巨頭高通宣布推出兩款數據中心人工智能芯片——AI200和AI250,兩款芯片對應的AI推理優化解決方案,可提供更高內存容量和優秀的AI推理優化,預計分別于2026年和2027年商用。

英偉達主導數據中心GPU不同的是,高通選擇了一條差異化競爭策略:以機架級性能、高內存實現快速的生成式AI推理為核心方向,強調其在能效、總擁有成本等方面的優勢。

AI200 推出一款專用機架級 AI 推理解決方案,旨在為大型語言和多模態模型 (LLM、LMM) 推理及其他 AI 工作負載提供低總擁有成本 (TCO) 和優化的性能。它支持每卡 768 GB LPDDR,可提供更高的內存容量和更低的成本,從而為 AI 推理提供卓越的擴展性和靈活性。

AI250 解決方案將首次采用基于近內存計算的創新內存架構,通過提供超過 10 倍的有效內存帶寬和更低的功耗,為 AI 推理工作負載帶來效率和性能的跨越式提升。

據悉,AI200 和 AI250 產品均采用直接液體冷卻技術進行冷卻,利用 PCIe 互連進行縱向擴展,利用以太網進行橫向擴展,并提供 160kW 的機架級功耗。高通沒有透露有關每個機架的芯片數量或機架將提供的計算性能的信息。

高通還透露,首批AI機架解決方案將于2026年起部署于中東客戶“HUMAIN”公司的數據中心。這被視為高通AI芯片商業化的重要里程碑。

沐曦C600登場,單卡算力和內存超越H20

在最新沐曦科技披露的IPO文件看,2025年前3個月,沐曦來自訓推一體系列產品的收入占比高達97.87%。沐曦科技主要產品覆蓋AI計算、通用計算、圖形渲染三大領域,先后推出用于智算推理的曦思N系列GPU、用于訓推一體和通用計算的曦云C系列GPU,以及正在研發用于圖形渲染的曦彩G系列GPU。

2023年,沐曦推出首款訓推一體GPU芯片曦云C500,并在此基礎上推出了曦云C550;該系列基于國產供應鏈的產品曦云C600已完成流片。

圖:曦云C600 圖片來自沐曦科技微信

以英偉達 H20為例,其核心優勢在于大容量顯存、高速互連帶寬、多精度計算能力等。曦云C500系列產品的單卡算力已超過 H20,最新一代曦云 C600 系列產品的單卡算力亦領先于英偉達H20,并具備 FP8 計算單元,能夠支持多精度計算。同時,曦云 C600 系列產品配備了大容量顯存,超過 H20 的96GB 版本,可以有效承載更大規模數據與模型、減少數據交換的性能損耗、提升多任務并行執行能力。

據悉,曦云C500系列產品的下游客戶以國家人工智能公共算力平臺、運營商智算平臺、商業化智算中心以及教科研、金融等行業客戶為主。

云天勵飛推出四款推理芯片,覆蓋邊緣到云的多種場景

云天勵飛在灣芯展展出了多款自研芯片——DeepEdge 10、DeepEdge 10C、DeepEdge 10 Max、DeepEdge 200,覆蓋從邊緣到云端的多種推理場景。

DeepEdge10芯片是云天勵飛自主研發的AI推理高性能芯片,采用國產14nm Chiplet工藝,并內置國產RISC-V核。該系列芯片基于“算力積木”AI芯片架構,能夠封裝成不同算力的芯片,覆蓋8T至256T的算力應用,可支持包括Transformer模型、BEV模型、CV大模型、LLM大模型等各類主流模型的高效推理,并已完成DeepSeek 系列模型以及國產鴻蒙操作系統的適配。

圖:云天勵飛四款AI推理芯片

公司還推出了更高階的 DeepEdge 200 芯片,面向更高并發和云端推理場景。該芯片采用 D2D Chiplet + C2C Mesh Torus 互連,可把多顆 Die 像積木一樣拼成 256 TOPS 的“單片”,這款芯片通過“算力積木”把 256 TOPS 級別的大算力塞進 35 W 功耗包絡,同時保留橫向擴展和軟件棧兼容性,成為目前國產 AI 推理芯片中少數能兼顧“邊緣高能效”與“云端高并發”的單芯片方案。

百度昆侖芯P800,部分性能與A100相當,中標中國移動采購大單

2025年2月20日,百度旗下的昆侖芯團隊正式發布了P800型號AI芯片,成為國產AI芯片領域的一次重大創新。此次發布的重要亮點在于,這款芯片首度支持單機部署DeepSeek V3/R1671B滿血版大模型。

推理性能:在運行DeepSeek-R1/V3滿血版671B模型時,昆侖芯P800單機8卡的量達到2437tokens/s,并發量達到256,比英偉達A100更快。在同樣負載情況下,P800的推理延遲比A100降低了18%。值得關注的是,昆侖芯P800在能耗方面比A100提高了約15%的功效比,在資源有限的環境中具有優勢。

2025 年中國移動 AI 通用計算(推理型)集采,P800 拿下三個標包 70%-100% 份額,標志著其進入電信級規模采購。

本文由電子發燒友原創,轉載請注明以上來源。微信號zy1052625525。需入群交流,請添加微信elecfans999,投稿爆料采訪需求,請發郵箱zhangying@huaqiu.com。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    54074

    瀏覽量

    466925
  • 高通
    +關注

    關注

    78

    文章

    7738

    瀏覽量

    199961
  • 云天勵飛
    +關注

    關注

    0

    文章

    184

    瀏覽量

    12669
  • 沐曦
    +關注

    關注

    1

    文章

    82

    瀏覽量

    1841
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    通挑戰英偉達,發布768GB內存AI推理芯片,“出征”AI數據中心

    電子發燒友網報道(文/莫婷婷)隨著生成式AI應用的爆發式增長,數據中心對高效、低成本、低功耗AI推理能力的需求急劇上升。
    的頭像 發表于 10-29 10:36 ?3693次閱讀
    <b class='flag-5'>高</b>通挑戰英偉達,發布768GB內存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>數據中心

    通挑戰英偉達!發布768GB內存AI推理芯片,“出征”AI數據中心

    電子發燒友網報道(文/莫婷婷)隨著生成式AI應用的爆發式增長,數據中心對高效、低成本、低功耗AI推理能力的需求急劇上升。
    的頭像 發表于 10-29 09:14 ?6536次閱讀
    <b class='flag-5'>高</b>通挑戰英偉達!發布768GB內存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>數據中心

    英偉達失守中國區!推理需求爆發,國產GPU搶灘上市

    億元。而在此前,另一家國產GPU公司摩爾線程已于9月26日率先過會。這兩大GPU企業接連沖刺IPO,背后是中國AI算力需求
    的頭像 發表于 10-22 09:09 ?8292次閱讀
    英偉達失守中國區!<b class='flag-5'>推理</b><b class='flag-5'>需求</b><b class='flag-5'>爆發</b>,<b class='flag-5'>國產</b><b class='flag-5'>GPU</b>搶灘上市

    國內首個國產AI推理千卡集群落地,采用云天勵飛全自研AI推理芯片

    3 月 12 日,云天勵飛中標湛江市AI滲透支撐新質生產力基礎設施建設項目,中標金額4.2億元。項目將基于云天勵飛自研的國產AI推理加速卡,建設國產
    發表于 03-12 11:10 ?1102次閱讀

    AI推理芯片需求爆發,OpenAI欲尋求新合作伙伴

    電子發燒友網綜合報道,在人工智能迅猛發展的當下,AI推理芯片需求正呈爆發式增長。 ? AI推理,
    的頭像 發表于 02-03 17:15 ?2987次閱讀

    曦望發布新一代推理GPU芯片,單位Token推理成本降低90%

    電子發燒友網報道 1月27日,國產GPU廠商曦望(Sunrise)重磅發布新一代推理GPU芯片——啟望S3。這是曦望在近一年累計完成約30億
    的頭像 發表于 01-28 17:38 ?9282次閱讀

    今日看點:消息稱 AMD、通考慮導入 SOCAMM 內存;曦望發布新一代推理GPU芯片啟望S3

    推理深度定制的GPGPU芯片。其單芯片推理性能提升5倍,支持從FP16到FP8、FP6、FP4等多精度靈活切換,釋放低精度推理效率,這種設計更貼合當前MoE和長上下文模型在推理階段的
    發表于 01-28 11:09 ?1190次閱讀

    瑞芯微SOC智能視覺AI處理器

    。B2版本通常在功耗、穩定性和部分外圍接口支持上有所優化。NPU: 集成0.8 TOPS的NPU,支持INT8/INT16混合運算,能滿足大多數邊緣側的輕量級AI推理需求(如分類、檢測、識別)。多媒體
    發表于 12-19 13:44

    Neway微波產品國產化替代方案

    了客戶的采購成本,還通過本地化生產縮短了交期,滿足了客戶對自主可控的需求。例如,在部分產品中,Neway通過采用國產電源組件,實現了與進口產品
    發表于 12-18 09:24

    算力積木+3D堆疊!GPNPU架構創新,應對AI推理需求

    電子發燒友網報道(文/李彎彎)2025年,人工智能正式邁入應用推理時代。大模型從實驗室走向千行百業,推理需求呈指數級爆發。然而,高昂的推理
    的頭像 發表于 12-11 08:57 ?7888次閱讀

    國產AI芯片真能扛住“算力內卷”?海思昇騰的這波操作藏了多少細節?

    最近行業都在說“算力是AI的命門”,但國產芯片真的能接住這波需求嗎? 前陣子接觸到海思昇騰910B,實測下來有點超出預期——7nm工藝下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
    發表于 10-27 13:12

    款全國產通用GPU芯片發布 沐曦集成推出曦云C600

    ,并支持MetaXLink超節點擴展技術,在硬件性能和軟件兼容上完全滿足下一代生成式AI的訓練和推理需求。 而且,沐曦股份與中國科學院合作的國產千卡集群,已完成多個大模型全參數訓練,證
    的頭像 發表于 10-19 20:04 ?4.7w次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰

    與邊緣AI的不同特點: 邊緣推理的優勢:可以提供數據處理速度和響應速度,滿足實時需求;可以縮短網絡延遲,降低成本;可以提高安全性和隱私性,保護用戶數據。 前面說的都是好處,那面臨的困難有哪些呢
    發表于 09-12 16:07

    國產真自研高性能圖形 GPU 重磅發布:跑分超 RTX4060,暢玩《黑神話?悟空》

    電子發燒友網報道(文 / 吳子鵬)7 月 26 日,礪算科技在 “砥礪算芯 超越極限” 產品發布會上,重磅發布GPU 芯片 “7G100” 系列和
    發表于 07-26 21:45 ?6150次閱讀
    <b class='flag-5'>國產</b>真自研高性能圖形 <b class='flag-5'>GPU</b> <b class='flag-5'>重磅</b>發布:跑分超 RTX4060,暢玩《黑神話?悟空》

    國產推理服務器如何選擇?深度解析選型指南與華頡科技實戰案例

    人工智能技術的爆發催生了對推理算力的迫切需求,而進口服務器的成本與技術依賴性,推動了國產推理
    的頭像 發表于 03-24 17:11 ?1330次閱讀
    <b class='flag-5'>國產</b><b class='flag-5'>推理</b>服務器如何選擇?深度解析選型指南與華頡科技實戰案例