電子發燒友網綜合報道,在人工智能迅猛發展的當下,AI推理芯片需求正呈爆發式增長。
AI推理,即支撐如ChatGPT這類AI模型響應用戶問題和請求的計算過程。過去,英偉達在訓練大型AI模型所需芯片領域占據主導,其GPU憑借強大的海量數據處理能力,成為全球AI爆炸式增長的重要基石。但隨著AI不斷演進,重點正從大規模訓練轉向對已訓練模型的推理和推斷,推理已然成為新的競爭戰場。業內普遍分析,到2026年,全球AI推理需求將超越AI訓練場景。
推理與訓練對芯片要求差異明顯。訓練側重海量數據處理,推理則對內存需求更高,因芯片需花更多時間從內存獲取數據。英偉達和AMD的GPU依賴外部內存,這會增加處理時間,降低用戶與聊天機器人交互速度。以OpenAI為例,其用于生成計算機代碼且大力推廣的產品Codex,部分性能不足就歸因于基于英偉達GPU的硬件。OpenAI首席執行官Sam Altman稱,使用其編程模型的客戶愿為編碼速度支付高溢價,為滿足需求,OpenAI最近與Cerebras達成合作。
自去年起,OpenAI積極尋找GPU替代方案,重點關注在同一塊硅片上集成大量內存(SRAM)的芯片制造商。在每顆芯片上集成更多昂貴的SRAM,能在聊天機器人等AI系統處理海量用戶請求時帶來速度優勢。
面對推理市場的巨大潛力,其他企業也紛紛布局。Anthropic的Claude和谷歌的Gemini等競爭產品,更多依賴谷歌自研的TPU進行部署。TPU專為推理計算設計,性能可能優于英偉達GPU這類通用型AI芯片。
英偉達也未坐視不理。不久前,它以200億美元收購一家AI推理芯片初創企業Groq的技術授權,并將核心團隊招入麾下。Groq專注極致推理,其創始人Jonathan Ross帶領谷歌TPU原班人馬,耗時七年打造出LPU(語言處理單元)架構,曾宣稱推理性能是英偉達H100 GPU的10倍,成本僅為其十分之一。
國內企業同樣在積極布局。曦望董事長徐冰預計,到2030年,AI推理在整個AI計算市場將占80%份額,聚焦極致推理的AI芯片未來爆發性更強。1月27日,國產GPU廠商曦望發布新一代推理GPU芯片——啟望S3。這款專為大模型推理打造的定制化GPGPU芯片,在典型推理場景下,整體性價比較上一代提升超10倍。在算力與存儲設計上,支持FP16至FP4精度切換,采用LPDDR6顯存方案,顯存容量提升4倍,有效緩解大模型推理的顯存瓶頸,成為國內首款采用此顯存方案的芯片。在主流大模型推理中,單位Token成本較上一代降低約90%,極大推動了大模型推理的大規模普惠應用。
云天勵飛自2014年成立便持續投入AI推理芯片研發,已推出四代基于深度神經網絡架構的自研NPU,并基于最新NPU架構推出多款芯片,應用于端側與邊緣側AI推理場景。公司副總裁鄭文先表示,正在研發的新一代芯片采用GPNPU架構,既適應GPU的CUDA生態,方便客戶模型牽引,又兼顧NPU的高效靈活,成本更具優勢,符合未來大模型在端側與邊緣側規模化落地的需求。董事長陳寧博士稱,未來AI需求轉向推理,對AI芯片需求也將從訓練芯片轉向推理芯片,GPNPU架構是通用型大算力云端推理芯片架構的最優解,公司將全力投入大算力AI推理芯片研發,打造極致推理效率和性價比的大模型云推理芯片。
AI推理,即支撐如ChatGPT這類AI模型響應用戶問題和請求的計算過程。過去,英偉達在訓練大型AI模型所需芯片領域占據主導,其GPU憑借強大的海量數據處理能力,成為全球AI爆炸式增長的重要基石。但隨著AI不斷演進,重點正從大規模訓練轉向對已訓練模型的推理和推斷,推理已然成為新的競爭戰場。業內普遍分析,到2026年,全球AI推理需求將超越AI訓練場景。
推理與訓練對芯片要求差異明顯。訓練側重海量數據處理,推理則對內存需求更高,因芯片需花更多時間從內存獲取數據。英偉達和AMD的GPU依賴外部內存,這會增加處理時間,降低用戶與聊天機器人交互速度。以OpenAI為例,其用于生成計算機代碼且大力推廣的產品Codex,部分性能不足就歸因于基于英偉達GPU的硬件。OpenAI首席執行官Sam Altman稱,使用其編程模型的客戶愿為編碼速度支付高溢價,為滿足需求,OpenAI最近與Cerebras達成合作。
自去年起,OpenAI積極尋找GPU替代方案,重點關注在同一塊硅片上集成大量內存(SRAM)的芯片制造商。在每顆芯片上集成更多昂貴的SRAM,能在聊天機器人等AI系統處理海量用戶請求時帶來速度優勢。
面對推理市場的巨大潛力,其他企業也紛紛布局。Anthropic的Claude和谷歌的Gemini等競爭產品,更多依賴谷歌自研的TPU進行部署。TPU專為推理計算設計,性能可能優于英偉達GPU這類通用型AI芯片。
英偉達也未坐視不理。不久前,它以200億美元收購一家AI推理芯片初創企業Groq的技術授權,并將核心團隊招入麾下。Groq專注極致推理,其創始人Jonathan Ross帶領谷歌TPU原班人馬,耗時七年打造出LPU(語言處理單元)架構,曾宣稱推理性能是英偉達H100 GPU的10倍,成本僅為其十分之一。
國內企業同樣在積極布局。曦望董事長徐冰預計,到2030年,AI推理在整個AI計算市場將占80%份額,聚焦極致推理的AI芯片未來爆發性更強。1月27日,國產GPU廠商曦望發布新一代推理GPU芯片——啟望S3。這款專為大模型推理打造的定制化GPGPU芯片,在典型推理場景下,整體性價比較上一代提升超10倍。在算力與存儲設計上,支持FP16至FP4精度切換,采用LPDDR6顯存方案,顯存容量提升4倍,有效緩解大模型推理的顯存瓶頸,成為國內首款采用此顯存方案的芯片。在主流大模型推理中,單位Token成本較上一代降低約90%,極大推動了大模型推理的大規模普惠應用。
云天勵飛自2014年成立便持續投入AI推理芯片研發,已推出四代基于深度神經網絡架構的自研NPU,并基于最新NPU架構推出多款芯片,應用于端側與邊緣側AI推理場景。公司副總裁鄭文先表示,正在研發的新一代芯片采用GPNPU架構,既適應GPU的CUDA生態,方便客戶模型牽引,又兼顧NPU的高效靈活,成本更具優勢,符合未來大模型在端側與邊緣側規模化落地的需求。董事長陳寧博士稱,未來AI需求轉向推理,對AI芯片需求也將從訓練芯片轉向推理芯片,GPNPU架構是通用型大算力云端推理芯片架構的最優解,公司將全力投入大算力AI推理芯片研發,打造極致推理效率和性價比的大模型云推理芯片。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
AI
+關注
關注
91文章
39793瀏覽量
301387 -
OpenAI
+關注
關注
9文章
1245瀏覽量
10067
發布評論請先 登錄
相關推薦
熱點推薦
從英偉達到博通:OpenAI自研芯片版圖浮出水面,開啟推理效率革命
電子發燒友網報道(文/莫婷婷)在人工智能大模型訓練與推理成本高企、算力需求呈指數級增長的背景下,OpenAI與Broadcom(博通)于10月正式宣布達成一項史無前例的戰略合作:共同部
Meta與NVIDIA達成多年戰略合作伙伴關系
NVIDIA 今天宣布與 Meta 達成一項多年期、跨多代產品的戰略合作伙伴關系,涵蓋本地部署、云計算和 AI 基礎設施。
軟通動力榮膺河南移動2025年DICT金牌合作伙伴
近日,以“金彩同行 智賦未來”為主題的河南移動2025年DICT金牌合作伙伴交流暨AI+領域合作能力展示大會在鄭州舉行。作為河南移動核心合作伙伴,軟通動力受邀出席,并憑借在DICT領域
軟通動力榮膺螞蟻數科“領航AI Agent合作伙伴”
12月11日,首屆螞蟻數科生態合作伙伴大會在蘇州召開。大會以“與AI同行· 價值共生”為主題,匯聚數字科技產業鏈核心力量,共探AI大模型產業落地路徑與生態協同機遇,軟通動力高級副總裁霍宇受邀出席會議
利爾達亮相2025中國移動全球合作伙伴大會,共創AI+時代新生態
//10月10日至12日,以“碳硅共生合創AI+時代”為主題的2025中國移動全球合作伙伴大會在廣州保利世貿博覽館盛大召開。作為中國移動的重要合作伙伴之一,利爾達攜多款明星產品與解決方案驚艷亮相
AI業界新聞:OpenAI官宣自研首顆芯片 黃仁勛時隔9年再次給馬斯克“送貨”
設計、博通負責制造與系統集成。博通與OpenAI已經簽署戰略合作,OpenAI與博通就共同開發和供應AI芯片達成了長期協議。 據悉,這是一款
NVIDIA攜手OpenAI構建AI基礎設施
NVIDIA 首席執行官黃仁勛、OpenAI 首席執行官 Sam Altman 和 OpenAI 總裁 Greg Brockman 宣布了一項新的合作伙伴關系,旨在推動 OpenAI
SILEX希來科與QUALCOMM高通公司長達15年的戰略合作伙伴關系 高通認證開發合作伙伴~高通官網能找到silex希來科
2005年起一直從事高通創銳訊無線局域網/藍牙模塊的開發、銷售和支持。
響應客戶需求,以自己公司的工廠和合作伙伴之間的協作構建起供應鏈,以“追求不掉線的無線”為目標,執著于品質的提升,并以一家足以將這些
發表于 08-28 23:33
SILEX希來科與高通公司長達15年的戰略合作伙伴關系 高通認證開發合作伙伴
SILEX希來科與高通公司長達15年的戰略合作伙伴關系 高通認證開發合作伙伴
AI+新能源,共創多贏!易事特集團2025數字能源合作伙伴聯席大會圓滿舉行
近日,中原腹地鄭州迎來了一場以“AI+新能源攜手創未來”為主題的行業盛會——2025易事特數字能源合作伙伴聯席大會。易事特集團數字能源核心團隊繼在北京成功舉辦合作伙伴大會之后,再度集結行業合作
2025聯想中國合作伙伴大會圓滿舉辦
近日,“同心同行 弄潮AI新時代”為主題的2025聯想中國合作伙伴大會在上海圓滿舉辦。聯想重磅宣布,面向合作伙伴的大聯想4.0迎來重大升級,發布總額超10億元的合作伙伴激勵計劃。
亞馬遜云科技發布“3+2”合作伙伴戰略 與合作伙伴加速前行
北京 ——2025 年 4 月 25 日 在亞馬遜云科技中國合作伙伴峰會上,亞馬遜云科技發布“3+2”合作伙伴戰略,聚焦全行業轉型、生成式AI、云遷移和現代化三大業務戰略,并通過亞馬遜云
發表于 04-25 14:43
?1014次閱讀
AI驅動生態升級 螢石2025渠道合作伙伴大會擘畫智能家居新藍圖
3月29日,以“AI聚力智拓新局”為主題的2025螢石渠道合作伙伴大會在紹興隆重舉行。這場匯聚全國1000余位合作伙伴的行業盛會,不僅是對2024年螢石卓越成績的復盤,更是面向AI時代
研華科技亮相華為中國合作伙伴大會2025
作為華為重要的APN合作伙伴,研華受邀參與“華為中國合作伙伴大會”,展示了基于昇騰310P平臺打造的邊緣AI解決方案及產品。
AI推理芯片需求爆發,OpenAI欲尋求新合作伙伴
評論