AMD祭出殺手锏,首個百億億級GPU
在不久前結束的 “加速數據中心”發布會上,AMD正式公開了下一代服務器CPU Milan-X和GPU加速卡Instinct MI200。這兩大產品系列不僅面向數據中心,也將面向一系列HPC和超算應用,把通用計算和AI性能推向極致。Instinct MI200作為GPU加速卡,更是成為超級計算機百億億級(Exascale)的算力的基本構成單元。
在市場合作上,AMD更是開始了新一輪的攻城略地,前不久剛和騰訊聯合發布了星星海服務器產品后,如今Azure等一眾公有云廠商也開始部署基于Milan-X的服務器,甚至將剛改名為Meta的Facebook也被拉攏至AMD陣營,宣布將在其數據中心部署AMD的服務器產品。
Milan-X:6nm的大緩存怪獸
繼上一代Milan處理器推出后不到一年,AMD就發布了該芯片的6nm改進版Milan-X。今年上半年通過融合Chiplet和Die堆疊兩大技術,在Ryzen桌面處理器上做了3D Chiplet架構的演示。如今第三代Epyc處理器Milan-X,將成為首個使用該技術的服務器產品。通過在Chiplet上堆疊緩存,Milan-X的L3緩存是Milan的三倍,達到了可怕的768MB。

MilanX / AMD
與英特爾一樣,AMD在正式發售前并沒有公布Milan-X的具體性能細節,而是通過合作伙伴的測試來展示了Milan-X在EDA和公有云應用中表現。在新思的VCS功能驗證中,Milan-X在1小時內完成了40.6項任務,而同樣核心數的Milan僅完成了24.4項。微軟在基于Milan-X的Azure服務器中進行了早期測試,無論是在航天模擬,還是在汽車碰撞測試建模中,Milan-X都做到了50%以上的性能提升。
除此之外,AMD CEO蘇資豐博士還透露了下一代5nm Epyc處理器Genoa的情報。基于Zen 4架構的Genoa將具備2倍的晶體管密度和2倍的能效,性能可以達到上一代的1.25倍以上。Genoa最高支持96個Zen 4核心,同時也將加入一系列新標準的支持,比如DDR5、PCIe 5.0和CXL。AMD還將推出基于5nm的Zen 4C核心的處理器Bergamo,專門針對要求多核多線程的云原生計算,最高核心數將達到128核,晚于Genoa發布。
Genoa計劃在2022年量產和發布,屆時很可能就是英特爾的Sapphire Rapids和AMD的Genoa在通用計算領域爭雄了。
Instinct MI200:GPU終于迎來MCM時代了?
除了Milan-X之外,發布會的最大亮點其實是全球首個MCM GPU,Instinct MI200。同樣基于臺積電的6nm工藝,Instinct MI200系列單芯片的晶體管數目達到580億,最高集成了220個計算單元。作為首個采用AMD CDNA2架構的服務器GPU,Instinct MI200的目標很明確,那就是將計算能力推向ExaScale級。
在CDN2架構和第二代HPC&AI專用矩陣核心的支持下,Instinct MI200實現了遠超競品的性能表現。數據對比環節,AMD選擇拿Nvidia目前最強的A100加速卡開刀。MI250X的FP64向量計算能力達到47.9TF,FP64矩陣計算能力達到95.7TF,均為A100的4.9倍。而在AI領域常用的FP16和BF16矩陣計算中,MI250X的算力也達到了383TF,是A100的1.2倍。即便兩者都用上了HBM2E,MI200的內存帶寬也達到了3.2TB/s,遠超A100的2TB/s。不過MI250X的功耗確實要高出不少,峰值狀態下的功耗可以達到560W,而A100的峰值功耗為300W。
與英特爾這種IDM廠商不同,AMD在封裝上基本吃透了與臺積電合作帶來的技術紅利,尤其是臺積電的3D Fabric封裝技術集合,而Instinct MI200則是這些技術的集大成之作。作為首個采用多Die設計的GPU,Instinct MI200選用了兩個SoC+8個HBM2E的方案,AMD在發布會上宣稱這一設計的實現要歸功于2.5D的Elevated Fanout Bridge(EFB)架構。
從圖解上來看,AMD的EFB與臺積電的InFO-L 2.5D封裝技術可以說是從一個模子里刻出來的。在專門用于HBM集成的方案,目前可以做到這種規模的異構似乎也只有臺積電的InFO-L和CoWoS-L,利用LSI(本地硅互聯)芯片,為SoC到SoC與SoC到HBM提供高布線密度的互聯。
其實英特爾也有類似的2.5D封裝方案EMIB,只不過該方案是在基板內放入一個硅橋die。而反觀AMD的EFB和臺積電的LSI方案則是將其至于基板的模具中,模具內分布著一系列銅柱。相較之下,EMIB雖然可以做到更低的寄生電感,卻也對于基板的加工提出了很高的要求,這也是為何只有英特爾這個基板大廠才使用EMIB的原因之一。不過隨著IDM 2..0模式的展開,英特爾也將公開提供自己的制程、IP和封裝技術,未來也許會有其他廠商的芯片開始用上EMIB。但目前來看,雖然增加了高度控制的挑戰,但為了使用標準的基板降低成本,EFB和LSI明顯是最優解。
在外觀尺寸上,AMD選擇了OAM和PCIe兩種形式。OAM為開放計算項目(OCP)定下的通用加速器模組標準,對于想要規模化部署GPU或其他加速器來說,OAM可以提供更大的帶寬。作為Facebook和微軟共同推行的公開標準,OAM已經在服務器領域有了不小的規模,不僅是英特爾、AMD和英偉達這些半導體廠商,浪潮、聯想、百度和阿里巴巴等其他服務器與公有云廠商也開始支持這一標準。
目前OAM的MI250和MI250X已經進入可交付階段,從今年第三季度起,AMD就已經在為美國能源部的橡樹嶺國家實驗室持續交付MI250X GPU了,用于組成美國首個ExaScale級別的超級計算機Frontier。除了OAM模組外,AMD也將在不久提供PCIe版本的MI210,用于非密集運算的場景。
結語
隨著英特爾、三星和臺積電在2.5D/3D封裝技術上的逐漸成熟,服務器芯片將成為受益最大的產品,未來2+8甚至3+8的MCM GPU可能更加常見。英偉達、AMD與英特爾三家在服務器/數據中心市場上的動向,也側面體現了IDM與Fabless廠商之間在技術選擇上的差異。英特爾如果不能盡快在制程和封裝上超越臺積電這樣的晶圓代工廠,在服務器市場的優勢可能會越來越小。
在不久前結束的 “加速數據中心”發布會上,AMD正式公開了下一代服務器CPU Milan-X和GPU加速卡Instinct MI200。這兩大產品系列不僅面向數據中心,也將面向一系列HPC和超算應用,把通用計算和AI性能推向極致。Instinct MI200作為GPU加速卡,更是成為超級計算機百億億級(Exascale)的算力的基本構成單元。
在市場合作上,AMD更是開始了新一輪的攻城略地,前不久剛和騰訊聯合發布了星星海服務器產品后,如今Azure等一眾公有云廠商也開始部署基于Milan-X的服務器,甚至將剛改名為Meta的Facebook也被拉攏至AMD陣營,宣布將在其數據中心部署AMD的服務器產品。
Milan-X:6nm的大緩存怪獸
繼上一代Milan處理器推出后不到一年,AMD就發布了該芯片的6nm改進版Milan-X。今年上半年通過融合Chiplet和Die堆疊兩大技術,在Ryzen桌面處理器上做了3D Chiplet架構的演示。如今第三代Epyc處理器Milan-X,將成為首個使用該技術的服務器產品。通過在Chiplet上堆疊緩存,Milan-X的L3緩存是Milan的三倍,達到了可怕的768MB。

MilanX / AMD
與英特爾一樣,AMD在正式發售前并沒有公布Milan-X的具體性能細節,而是通過合作伙伴的測試來展示了Milan-X在EDA和公有云應用中表現。在新思的VCS功能驗證中,Milan-X在1小時內完成了40.6項任務,而同樣核心數的Milan僅完成了24.4項。微軟在基于Milan-X的Azure服務器中進行了早期測試,無論是在航天模擬,還是在汽車碰撞測試建模中,Milan-X都做到了50%以上的性能提升。
除此之外,AMD CEO蘇資豐博士還透露了下一代5nm Epyc處理器Genoa的情報。基于Zen 4架構的Genoa將具備2倍的晶體管密度和2倍的能效,性能可以達到上一代的1.25倍以上。Genoa最高支持96個Zen 4核心,同時也將加入一系列新標準的支持,比如DDR5、PCIe 5.0和CXL。AMD還將推出基于5nm的Zen 4C核心的處理器Bergamo,專門針對要求多核多線程的云原生計算,最高核心數將達到128核,晚于Genoa發布。
Genoa計劃在2022年量產和發布,屆時很可能就是英特爾的Sapphire Rapids和AMD的Genoa在通用計算領域爭雄了。
Instinct MI200:GPU終于迎來MCM時代了?
除了Milan-X之外,發布會的最大亮點其實是全球首個MCM GPU,Instinct MI200。同樣基于臺積電的6nm工藝,Instinct MI200系列單芯片的晶體管數目達到580億,最高集成了220個計算單元。作為首個采用AMD CDNA2架構的服務器GPU,Instinct MI200的目標很明確,那就是將計算能力推向ExaScale級。
在CDN2架構和第二代HPC&AI專用矩陣核心的支持下,Instinct MI200實現了遠超競品的性能表現。數據對比環節,AMD選擇拿Nvidia目前最強的A100加速卡開刀。MI250X的FP64向量計算能力達到47.9TF,FP64矩陣計算能力達到95.7TF,均為A100的4.9倍。而在AI領域常用的FP16和BF16矩陣計算中,MI250X的算力也達到了383TF,是A100的1.2倍。即便兩者都用上了HBM2E,MI200的內存帶寬也達到了3.2TB/s,遠超A100的2TB/s。不過MI250X的功耗確實要高出不少,峰值狀態下的功耗可以達到560W,而A100的峰值功耗為300W。
與英特爾這種IDM廠商不同,AMD在封裝上基本吃透了與臺積電合作帶來的技術紅利,尤其是臺積電的3D Fabric封裝技術集合,而Instinct MI200則是這些技術的集大成之作。作為首個采用多Die設計的GPU,Instinct MI200選用了兩個SoC+8個HBM2E的方案,AMD在發布會上宣稱這一設計的實現要歸功于2.5D的Elevated Fanout Bridge(EFB)架構。
從圖解上來看,AMD的EFB與臺積電的InFO-L 2.5D封裝技術可以說是從一個模子里刻出來的。在專門用于HBM集成的方案,目前可以做到這種規模的異構似乎也只有臺積電的InFO-L和CoWoS-L,利用LSI(本地硅互聯)芯片,為SoC到SoC與SoC到HBM提供高布線密度的互聯。
其實英特爾也有類似的2.5D封裝方案EMIB,只不過該方案是在基板內放入一個硅橋die。而反觀AMD的EFB和臺積電的LSI方案則是將其至于基板的模具中,模具內分布著一系列銅柱。相較之下,EMIB雖然可以做到更低的寄生電感,卻也對于基板的加工提出了很高的要求,這也是為何只有英特爾這個基板大廠才使用EMIB的原因之一。不過隨著IDM 2..0模式的展開,英特爾也將公開提供自己的制程、IP和封裝技術,未來也許會有其他廠商的芯片開始用上EMIB。但目前來看,雖然增加了高度控制的挑戰,但為了使用標準的基板降低成本,EFB和LSI明顯是最優解。
在外觀尺寸上,AMD選擇了OAM和PCIe兩種形式。OAM為開放計算項目(OCP)定下的通用加速器模組標準,對于想要規模化部署GPU或其他加速器來說,OAM可以提供更大的帶寬。作為Facebook和微軟共同推行的公開標準,OAM已經在服務器領域有了不小的規模,不僅是英特爾、AMD和英偉達這些半導體廠商,浪潮、聯想、百度和阿里巴巴等其他服務器與公有云廠商也開始支持這一標準。
目前OAM的MI250和MI250X已經進入可交付階段,從今年第三季度起,AMD就已經在為美國能源部的橡樹嶺國家實驗室持續交付MI250X GPU了,用于組成美國首個ExaScale級別的超級計算機Frontier。除了OAM模組外,AMD也將在不久提供PCIe版本的MI210,用于非密集運算的場景。
結語
隨著英特爾、三星和臺積電在2.5D/3D封裝技術上的逐漸成熟,服務器芯片將成為受益最大的產品,未來2+8甚至3+8的MCM GPU可能更加常見。英偉達、AMD與英特爾三家在服務器/數據中心市場上的動向,也側面體現了IDM與Fabless廠商之間在技術選擇上的差異。英特爾如果不能盡快在制程和封裝上超越臺積電這樣的晶圓代工廠,在服務器市場的優勢可能會越來越小。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
amd
+關注
關注
25文章
5682瀏覽量
139937 -
cpu
+關注
關注
68文章
11277瀏覽量
224949 -
gpu
+關注
關注
28文章
5194瀏覽量
135431
發布評論請先 登錄
相關推薦
熱點推薦
AMD獲Meta千億美元芯片大單,AI芯片市場格局生變
GPU的AMD Helios整機柜服務器,預計于今年晚些時候開啟交付。 AMD首席執行官蘇姿豐稱,交易價值每吉瓦達百億美元級別,協議總金額或超600
國產GPU再下一城,群起突圍英偉達+AMD
電子發燒友網報道(文/黃晶晶)去年底以來國產GPU廠商陸續開啟上市輔導,最近摩爾線程、沐曦IPO獲受理。另消息稱,壁仞科技已完成新一輪約15億元融資,并計劃最快今年8月向港交所申請IPO,籌備赴港
解析ISL62776:AMD CPU/GPU核心電源的理想之選
解析ISL62776:AMD CPU/GPU核心電源的理想之選 在如今的電子設備中,CPU和GPU的性能不斷提升,對電源管理的要求也越來越高。ISL62776作為一款專為AMD CPU
強勢進入企業SATA SSD賽道!江波龍有哪些殺手锏,加入中移動產業鏈
10月10日到12日,中國移動全球合作伙伴大會上,國產存儲廠商頭部企業江波龍以“存算合一,合創AI+時代”的主旨高調亮相,展示了企業級SATA SSD、LPCAMM2、SOCAMM2、UFS4.1、DDR4等重磅產品。電子發燒友記者親自現場采訪,與技術大咖交流,為大家分享這些重磅產品的“含金量”。
UWB技術正迅速崛起!出貨千萬顆,馳芯半導體有哪些殺手锏產品?
電子發燒友原創 章鷹 2025年,更多搭載UWB的芯片產品出現。小米5月發布的“玄戒O1“處理器支持UWB超寬帶互聯。6月26日,國內UWB車規級芯片方案提供商長沙馳芯半導體傳來喜訊,其CX500
aicube的n卡gpu索引該如何添加?
請問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經安裝了cuda和cudnn,在全局的py里添加了torch,能夠調用gpu,當還是只能看到默認的gpu0,顯示不了gpu1
發表于 07-25 08:18
瑞之辰傳感器:從“卡脖子”到“殺手锏”的技術突圍
壓力傳感器的國產化替代,將這一“卡脖子”難題逐步轉變為自身的技術“殺手锏”。破解“卡脖子”的技術密碼當動力電池安全監測需要精度達1%FS的微型壓力傳感器時,當工業自動化
安富利低功耗傳感器解決方案助力可穿戴設備創新
大規模商用的貼身醫療終端。再看去年華為WATCH D2海外亮相,直接祭出24小時動態血壓監測的殺手锏。從心電圖(ECG)、血氧到車禍檢測,再到血壓監測,智能手表這波操作,簡直就是你的“賽博扁鵲”本鵲!
NVIDIA NVLink 深度解析
了現代計算工作負載日益增長的需求。與通用性 PCIe 相比,NVLink 專為滿足高性能計算和人工智能領域中緊密耦合的 GPU 所需的大規模數據交換而設計。這項技術對于充分發揮百億億次級計算的潛力以及
新能源電網穩壓神器ACR10R-E4S/CE
新能源發電的"卡脖子"難題日益嚴峻,電網頻率劇烈波動,傳統監測設備力不從心。ACR10R-E4S/CE智能電測設備以其快速響應、亞赫茲精度和工業以太網直連三大殺手锏,重塑調頻游戲規則。
京東方精電2024年營收破百億
近日,在香港聯交所上市的BOE(京東方)旗下全球車載業務平臺京東方精電(股份代號:00710.HK)發布2024年度業績公告,以134.49億港元(約合125.72億人民幣)的營業收入成功突破百億
智能制造時代,設備管理系統的五大“殺手锏”功能
智能制造的核心路徑是設備管理系統的智能化水平。實時監控與故障預測,智能維護調度,備件管理數字化,能效優化與綠色生產,移動端應用場景為智能制造帶來顯著價值。
專訪AMD Jack Huynh:重新定義異構AI計算的行業標準,堅守以用戶為核心的AI適配戰略
與AMD高級副總裁,計算及圖形業務集團總經理Jack Huynh先生,就AMD全線產品的未來策略與布局進行了深度交流。 消費級GPU與企業級
專訪AMD王啟尚 從RDNA 4到FSR 4,AMD GPU技術創新引領行業新發展
在近日于珠海舉辦的AMD新一代Radeon RX 9070系列顯卡發布會后,AMD GPU技術與工程研發副總裁王啟尚接受了我們的專訪。在本次交談中,他詳細分享了RDNA 4架構的設計理念、FSR 4
AMD祭出殺手锏,首個百億億級GPU
評論