電子發燒友網報道(文/黃晶晶)近日,阿里平頭哥AI算力卡PPU在央視新聞被曝光,在“國產卡與NV卡重要參數對比”表格中顯示,其PPU在顯存、片間帶寬等多項硬件參數均超越英偉達A800,介于英偉達A800和H20之間。
根據報道,平頭哥PPU采用HBM2e顯存,單卡顯存容量96GB,片間帶寬為700GB/s,采用PCIe5.0×16通道接口,單卡功耗為400W。英偉達A800顯存同樣采用HBM2e,單卡顯存80GB,片間帶寬400GB/s,接口規格是PCIe4.0×16,功耗400W;而H20的顯存和片間帶寬更強,單卡96GB HBM3顯存,片間帶寬為900GB/s,采用PCIe5.0×16接口,但功耗較高為550W。
另外還有,華為昇騰910B單卡采用64GB HBM2顯存,片間帶寬392GB/s,接口為PCIe4.0×16,功耗350W;壁仞104P單卡搭載32GB HBM2e顯存,片間帶寬256GB/s,采用PCIe5.0×16接口,功耗為300W。
我們可以看到,相當水平的AI算力卡,它們的存儲規格基本在HBM2/2e、HBM3這一階段。
根據報道,平頭哥PPU采用HBM2e顯存,單卡顯存容量96GB,片間帶寬為700GB/s,采用PCIe5.0×16通道接口,單卡功耗為400W。英偉達A800顯存同樣采用HBM2e,單卡顯存80GB,片間帶寬400GB/s,接口規格是PCIe4.0×16,功耗400W;而H20的顯存和片間帶寬更強,單卡96GB HBM3顯存,片間帶寬為900GB/s,采用PCIe5.0×16接口,但功耗較高為550W。
另外還有,華為昇騰910B單卡采用64GB HBM2顯存,片間帶寬392GB/s,接口為PCIe4.0×16,功耗350W;壁仞104P單卡搭載32GB HBM2e顯存,片間帶寬256GB/s,采用PCIe5.0×16接口,功耗為300W。
我們可以看到,相當水平的AI算力卡,它們的存儲規格基本在HBM2/2e、HBM3這一階段。

HBM對于AI芯片的重要性
高帶寬內存HBM是一種基于3D堆棧技術的DRAM,通過TSV(硅通孔)和芯片堆疊架構實現高速數據傳輸與低能耗特性。該技術由三星、AMD和SK海力士共同提出,2013年SK海力士首次量產HBM芯片,2015年首次應用于AMD Fiji GPU。
隨著 AI大模型向千億、萬億級等大參數、以及FP8/FP4 高精度低比特計算方向演進,傳統內存方案已無法滿足數據傳輸效率需求。AI 計算需反復調用海量參數,如 GPT-3的1750億參數需占用數百GB內存,且計算單元呈大規模并行架構,每秒需從內存讀取/寫入TB級數據。若數據供給不及時,會造成芯片實際性能大幅低于理論峰值。
HBM在AI服務器GPU中成為主流解決方案,是當前AI算力芯片突破性能瓶頸的核心關鍵技術,其3D堆疊技術有效提升內存帶寬并減少延遲。
HBM六代產品演進
目前HBM總共有六代產品,分別為HBM1、HBM2、HBM2E、HBM3、HBM3E、HBM4。SK海力士于2013年首次開發HBM DRAM(第一代)產品,隨后以HBM2(第二代)、HBM2E(第三代)、HBM3(第四代)的順序開發。
2018年SK海力士發布第二代HBM產品HBM2,2020年發布第三代產品HBM2E是HBM2的擴展版本,HBM2E速度更快、容量更大、散熱性能更高。
SK海力士于2021年10月推出全球首款HBM3,并在2022年6月實現量產。該款HBM3每個引腳傳輸速率達6.4Gbps,1024位寬接口,最高帶寬可達819GB/s,較HBM2E(460GB/s)高約78%。16Gb內核密度、尖端的TSV垂直堆疊技術,滿足了系統對更高密度的要求,該技術可實現12層堆疊內存立方體,從而實現最大24GB封裝密度。
2024年,SK海力士全球率先開始量產 8/12層HBM3E,實現了現有HBM產品中最大的36GB容量。11月4日,海力士正式宣布開發全球最大容量16層堆疊HBM3E。
?圖源:SK海力士
SK海力士2025年9月宣布,已成功完成面向AI的超高性能存儲器新產品HBM4的開發,并在全球首次構建了量產體系。這次全新構建量產體系的HBM4采用了較前一代產品翻倍的2048條數據傳輸通道(I/O),將帶寬擴大一倍,同時能效也提升40%以上。憑借這一突破,該產品實現了全球最高水平的數據處理速度和能效。公司預測,將該產品引入客戶系統后,AI服務性能最高可提升69%,這一創新不僅能從根本上解決數據瓶頸問題,還可顯著降低數據中心電力成本。
與此同時,此次HBM4實現高達10Gbps(每秒10千兆比特)以上的運行速度,這大幅超越JEDEC標準規定的8Gbps(每秒8千兆比特)。公司在HBM4的開發過程中采用了產品穩定性方面獲得市場認可的自主先進MR-MUF技術和第五代10納米級(1b)DRAM工藝,最大程度地降低其量產過程中的風險。
華為自研HBM
根據華為近日在全聯接大會2025上公布的信息,昇騰950PR芯片架構新增支持低精度數據格式,其中FP8/MXFP8/HIF8: 1 PFLOPS,MXFP4: 2 PFLOPS,重點提升向量算力,提升互聯寬帶2.5倍,支持華為自研HBM高帶寬內存,分為HiBL 1.0和HiZQ 2.0兩個版本。HiBL 1.0容量128GB,帶寬1.6TB/s。HiZQ 2.0容量144GB,帶寬4TB/s。
昇騰950PR芯片采用950核心+HiBL 1.0內存,可提升推理Prefill(預填充)性能,提升推薦業務性能。昇騰950DT采用HiZQ 2.0內存,可提升推理Decode(解碼)性能,提升訓練性能,提升內存容量和帶寬。
根據規劃,2026年第一季度將推出昇騰950PR,2026年第四季度計劃推出昇騰950DT。2027年第四季度將推出昇騰960芯片,預計在各項規格上相比前代產品將有大幅提升。2028年第四季度規劃推出昇騰970芯片,這將是該系列中的高端產品,預計在算力和互聯帶寬等方面實現全面升級。
遠見智存HBM2/2e已完成終試
此前有報道,深圳遠見智存成功實現HBM2e芯片量產,并計劃于2025年春節前后初步完成下一代HBM3/HBM3e前端設計。
遠見智存成立于2023年,擁有一支由行業精英組成的團隊,團隊成員在HBM技術方面具有深厚的積淀和豐富的經驗。據介紹,通過技術創新,公司成功繞開TSV(Through-Silicon Via)及CoWoS(Chip-on-Wafer-on-Substrate)等關鍵技術瓶頸,使得HBM2e的國產化得以順利實現。
同時,遠見智存依規提供符合高堆疊JEDEC標準的HBM產品,并整合國內高端封裝資源,推出自主可控的HBM3/3e產品,為AI訓練芯片產業注入動力。
針對遠見智存的HBM存儲芯片的研發進度,目前公開信息顯示,中天精裝間接持有深圳遠見智存股權,穿透計算的持股比例為6.71%。中天精裝表示,公司參股企業深圳遠見智存科技聚焦高帶寬存儲芯片(HBM)領域,目前HBM2/2e產品已完成終試,正在推動量產和升級;HBM3/3e處于研發階段,已完成前期預研和部分設計工作。
另外,今年7月,賽博格機器人與芯璣半導體和量子芯云聯合推出內置DNPU和LPDDR5的存算一體化芯片和全球首顆移動HBM。
隨著AI大模型向更大參數、更多模態演進,HBM與AI 芯片將深度綁定,HBM的技術迭代將為AI算力推波助瀾。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
HBM
+關注
關注
2文章
428瀏覽量
15740 -
AI芯片
+關注
關注
17文章
2077瀏覽量
36596
發布評論請先 登錄
相關推薦
熱點推薦
GPU猛獸襲來!HBM4、AI服務器徹底引爆!
電子發燒友網報道(文/黃晶晶)日前,多家服務器廠商表示因AI服務器需求高漲拉高業績增長。隨著AI服務器需求旺盛,以及英偉達GPU的更新換代,勢必帶動HBM供應商的積極產品推進。三星方面HBM
國產AI芯片沖至160億美元:狂歡下的“可靠性”大考
國產AI芯片年銷售額達160億美元,標志著設計環節實現突破,但商業落地的核心考驗已轉向可靠性。AI芯片因高算力、高功耗特性,面臨電源與時鐘穩
國產TDDI芯片:藏在屏幕背后的"隱形冠軍",誰能笑到最后?
市場被海外巨頭壟斷,如今國產玩家正迎頭趕上。這場"屏幕背后的戰爭",到底誰更有機會勝出? TDDI芯片:為什么手機廠商都愛它? 傳統方案中,觸控和顯示需要兩顆獨立芯片,就像兩個人各管一
國產AI芯片真能扛住“算力內卷”?海思昇騰的這波操作藏了多少細節?
最近行業都在說“算力是AI的命門”,但國產芯片真的能接住這波需求嗎?
前陣子接觸到海思昇騰910B,實測下來有點超出預期——7nm工藝下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
發表于 10-27 13:12
紫光國芯存儲芯片國產替代方案:打破DDR5/HBM芯片供應鏈瓶頸
貞光科技作為紫光國芯核心代理商,主推其DDR5/HBM國產替代方案。紫光國芯的高性能存儲產品已廣泛應用于信創及數據中心,貞光科技提供全線產品供應與技術服務,助力打破供應鏈壟斷,保障關鍵基礎設施的自主
SK海力士宣布量產HBM4芯片,引領AI存儲新變革
在人工智能(AI)技術迅猛發展的當下,數據處理與存儲能力成為制約其進一步飛躍的關鍵因素。2025 年 9 月 12 日,韓國半導體巨頭 SK 海力士宣布,已成功完成面向 AI 的超高性能存儲器新產品
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰
②Transformer引擎③NVLink Switch系統④機密計算⑤HBM
FPGA:
架構的主要特點:可重構邏輯和路由,可以快速實現各種不同形式的神經網絡加速。
ASIC:
介紹了幾種ASIC AI芯片
發表于 09-12 16:07
性能優于HBM,超高帶寬內存 (X-HBM) 架構來了!
電子發燒友網綜合報道,NEO Semiconductor宣布推出全球首款用于AI芯片的超高帶寬內存 (X-HBM) 架構。該架構旨在滿足生成式AI和高性能計算日益增長的需求,其32Kb
【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》
名單公布
@LiuDW、@jinglixixi、@bruceleesohu
請于9月3日前,前往【書籍評測活動NO.64】《AI芯片:科技探索與AGI愿景》完成書籍兌換。
如有疑問請 添加小助手微信
發表于 07-28 13:54
HBM應用在手機上,可行嗎?
? 電子發燒友網報道(文/梁浩斌)最近有不少關于HBM技術被應用到手機的消息,此前有消息稱蘋果會在20周年iPhone,也就是2027年推出使用HBM DRAM的iPhone手機,提高端側AI能力
國產 vs 進口貼片固態電容:技術差距縮小,本土化替代加速
差異、市場表現及未來趨勢,探討國產替代的機遇與挑戰。 ? 1.性能對比:國產技術迎頭趕上 ? (1)關鍵參數差距縮小 ? - ESR(等效串聯電阻):早期國產固態電容的ESR較高,影響
不再是HBM,AI推理流行,HBF存儲的機會來了?
NAND閃存和高帶寬存儲器(HBM)的特性,能更好地滿足AI推理的需求。 ? HBF的堆疊設計類似于HBM,通過硅通孔(TSVs)將多個高性能閃存核心芯片堆疊,連接到可并行訪問閃存子
deepseek國產芯片加速 DeepSeek的國產AI芯片天團
,從而紛紛繼續“卷”起來,效仿DeepSeek的“開源”模式。 對于DeepSeek本身,人們關注其如何在有限算力實現強大性能,更關注其在重重條令圍城之下的未來之路。而在最近,全世界的芯片廠商集體出動,紛紛宣布支持DeepSeek。尤其是眾多國產
SK海力士增產HBM DRAM,應對AI芯片市場旺盛需求
SK海力士今年計劃大幅提升其高帶寬內存(HBM)的DRAM產能,目標是將每月產能從去年的10萬片增加至17萬片,這一增幅達到了70%。此舉被視為該公司對除最大客戶英偉達外,其他領先人工智能(AI)芯片公司需求激增的積極回應。
AI興起推動HBM需求激增,DRAM市場面臨重塑
TechInsights的最新報告揭示了AI興起對高帶寬內存(HBM)需求的巨大影響。特別是在機器學習和深度學習等數據密集型應用中,HBM的需求呈現出前所未有的高漲態勢。 報告預測,到2025年

HBM迎頭趕上!國產AI芯片飛躍
評論