今年6月,AMD發布了一款專門針對AI需求的最新款芯片:Instinct MI300。
MI300將CPU、GPU和內存封裝在了一起,晶體管數量高達1460億個,接近英偉達H100的兩倍。其搭載的HBM(高帶寬內存)密度也達到了H100的2.4倍。也就是說,MI300在理論上可以運行比H100更大的AI模型。
受益于AI訓練的增長,GPU需求肉眼可見的從游戲市場向高性能計算領域傾斜,就連剛開啟GPU產品線的英特爾,也迫不及待的PPT首發了面向高性能計算場景的Falcon Shores架構芯片。
伴隨英偉達一路沖向萬億美元市值,資本市場對GPU行業老二的期待值也達到了頂峰。今年以來,AMD股價累計上漲已經超過90%。
英特爾的Falcon Shores,預計2024年推出
然而MI300發布會結束,AMD股價下跌3.6%,反倒是英偉達上漲3.9%。資本市場表達好惡,向來是這么冷酷無情。
原因可能在于,AMD沒有在發布會中透露這款芯片的客戶,這也是市場對英偉達以外的AI芯片最大的擔心。
長期以來,AMD在GPU市場一直被英偉達按在地上反復摩擦,Instinct產品線其實已經迭代了好幾年,但相比英偉達的連戰連捷,AMD在高性能計算領域的存在感一直比較稀薄。
AI訓練打開的市場空間,一度被市場視為AMD與英偉達拉進距離的機會,但事情似乎沒那么簡單。
離不開CPU,但離得開英特爾
雖說在AI訓練上,更擅長大規模并行計算的GPU承擔了大部分計算工作,而整個系統仍需要CPU進行調度和統籌。也就是說,盡管GPU的需求量大幅度增加,但CPU仍是必需品。
作為一家同時擁有CPU和GPU設計能力的芯片公司,AMD被看好也不意外。更何況過去幾年,AMD在CPU市場連戰連捷。
AMD現任CEO蘇姿豐在2014年接手,時值推土機架構性能孱弱,讓英特爾心安理得的擠牙膏。而在賣掉Imageon后,AMD和拒絕為蘋果設計iPhone芯片的英特爾一起,完美錯過了智能手機的浪潮,公司一片風雨飄搖。
面臨多條戰線的失血,蘇姿豐只能將有限的資源集中在核心的CPU業務上,從蘋果請回了架構大師吉姆·凱勒,開始Zen架構處理器的研發。
2017年,Zen架構處理器橫空出世,把擠牙膏上癮的英特爾打了個措手不及。2019年,Zen處理器更換為臺積電7nm工藝,此時英特爾10nm工藝姍姍來遲。
雖然英特爾還占據著大部分市場份額,但AMD的反攻速度實在太快,尤其是在服務器市場,幾乎是從0殺到了接近20%的市占率。
2023年Q1,AMD的x86處理器市場份額達到了34.6%這一歷史峰值[2],這也是AMD市值超過英特爾的重要背景。

今年5月,全球超級計算機Top500強公布:前500強中,使用AMD CPU進行驅動的超算達到121臺,使用英特爾CPU的超算則從2016年的454臺下降至360臺,雖然看著不少,但其中很多是英特爾10年前的家底——至強(Xeon)處理器[3]。
但同一時期,AMD與英偉達差距也越來越大。
難以逾越的CUDA
英偉達不僅是一流的硬件公司,更是一流的軟件公司。
雖然在理論性能上,MI300的一些參數甚至領先于英偉達,但市場對英偉達對手們最大的擔心往往在于,就算硬件性能可以跟英偉達比肩,但是軟件解決方案仍難以與英偉達的CUDA對抗。
2006年,英偉達推出了CUDA平臺,讓開發者能夠給予GPU進行編程和開發,最終形成了一個龐大穩固的生態。在推出CUDA之前,全球能用GPU進行編程的不足100人,目前CUDA的使用者超過400萬。
每一個成功的硬件公司背后,往往都有一個更強大的軟件團隊,蘋果和英偉達都是如此。即便是***制造商ASML也不例外,他們的官方網站上有這樣一段話:
您可能將ASML視為一家硬件公司,但實際上我們擁有世界上最大、最具開創性的軟件社區之一。如果沒有我們開發的軟件,我們的客戶就不可能制造出10納米或更小的尺寸的芯片。
想要芯片真正在具體場景的滿足各種需求,就需要開發者對硬件進行編程以實現各種功能。如果說硬件編程的過程相當于進行各種復雜計算,那么CUDA就是提供給使用者的一部計算器。
無論對英偉達的刀法多么懷恨在心,都不能否認黃仁勛對通用計算和人工智能的超前押注。
AMD顯然深知軟件和生態的重要性,但對標CUDA的ROCm在2016年推出時,就已經比英偉達晚了十年。
直到2023年4月,ROCm都僅支持Linux平臺;而CUDA自問世以來,就提供Windows和Linux兩個版本,后期還為蘋果用戶增設Mac OS版本。
相比英偉達不遺余力的推廣和洗腦,AMD在生態建設上也顯得投入不足,據說早年英偉達對項目的GPU試用申請幾乎是有求必應,動不動就去高校實驗室發顯卡。深度學習大神杰夫·辛頓帶著學生訓練AlexNet模型,就用了三塊GTX 580。
另外,AMD的軟件能力也令人不安——AMD在今年6月發布了一份EPYC 7002 “Rome”服務器芯片指南,承認由于時鐘倒計時器存在 BUG,導致第二代EPYC芯片運行1044天后,會出現內核卡死。如果有服務器使用這款芯片,需要每隔2.93年重新啟動一次。
原因也不難理解,直到推出ROCm的2016年,AMD甚至還沒擺脫虧損。在這期間,AMD只能把有限的資源都聚焦在CPU的研發上,無法為GPU部門投入太多資源,更不要說ROCm的軟件團隊了。
而當AMD在CPU市場收復失地,希望依靠AI卷土重來時,英偉達已經慢慢補齊了短板。
英偉達的反攻
2020年9月,英偉達宣布準備以400億美元的價格準備收購移動CPU架構商Arm,其背后意圖人盡皆知:一方面是整合移動端資源,另一方面則是入局CPU。
正如前文所說,盡管AI時代需要更多的GPU,但CPU仍不可或缺。當CPU與GPU共同在服務器中的工作時,實際場景更像是一個大學生(CPU)帶領一群小學生(GPU)組隊完成各種任務。這個時候,配合就顯得尤為重要。
因此,英偉達之所以自己做CPU,并非完全因為英特爾或AMD,而是從自身產品需求出發,使CPU和GPU緊密耦合,以發揮最大性能。比如CPU和GPU中,需要用到盡可能相似技術的一致內存,以保證數據之間的無縫共享[8]。
雖然收購基本沒有成功的可能性,但英偉達依然按部就班的招兵買馬。2021年4月,黃仁勛在自家廚房里宣布,英偉達即將推出首款5nm制程工藝CPU Grace,基于Arm架構,面向超大型 AI 模型的和高性能計算。
緊接著就是具體工作的有序展開:英偉達首先選定了根據地以色列,那里有全球第三多的納斯達克上市公司(僅次于美國和中國);然后對外招聘600名硬件工程師、軟件工程師和芯片設計師,搭建CPU研發團隊[7]。
最后,英偉達挖來了英特爾在以色列的CPU架構專家Rafi Marom,后者曾參與10nm制程的Tiger Lake和Alder lake芯片開發工作。
在2022年3月的GTC大會上,英偉達對外宣布Grace CPU性能:擁有144個Arm內核和1TB/s的內存帶寬,性能較當前最先進的DGX A100搭載的雙CPU相比高1.5倍以上。
不過,原本預計在今年上半年可以開始供貨的Grace芯片,目前已推遲至下半年。
APU
InstinctMI300本質上是一顆“APU”,這是AMD早在2009年提出的一個概念——將CPU和GPU集成在一起,使得二者高速互聯,實現1+1>2的效果。
在2006年收購了GPU公司ATI后,AMD成為了當時唯一同時擁有CPU和GPU設計能力的芯片公司,而且在兩個市場都是行業老二——但壞消息是,市場主流玩家也就兩個。
在這種局面下,AMD希望借助APU打開市場局面。2011年,第一代APU推出后,AMD持續宣傳APU是“x86架構三十年來的最大革命”,并向投資者強調,這款產品存在著“強勁且被壓抑”的需求。
市場最初也對APU概念充滿期待,結果2012年Q3財報出爐,AMD收入下滑25%,順便減記了1億美元的庫存——APU需求量并不高,芯片根本賣不出去[1]。緊接著,公司股價跌到1.86美元的歷史性低點,蘇姿豐臨危受命,開始掌舵風雨飄搖中的AMD。
APU的優勢在于,由于CPU和GPU集成在了一起,數據傳輸效率得到了大幅度提高。蘋果的M1 Ultra也采用了類似的“把幾個小芯片拼成一塊大芯片”的思路,換來了更強的數據吞吐能力。
但在2009年,APU的理念顯得過于超前。
一方面,APU涉及芯片的先進封裝技術,在當時既不成熟,成本也難以控制。另一方面,APU在需求高度多元化的消費市場很難行得通。
比如10種型號的CPU和GPU,理論上有100種組合方案,這就導致做10種方案無法滿足市場需求,做100種方案難以收回生產成本。
因此在很長一段時間里,APU只能在PS4游戲機這類高度標準化的產品上才能找到市場。但深度學習的大爆發改變了這一點。
相比游戲和渲染,AI訓練對算力和數據吞吐效率的需求成百上千倍的增加,目前針對AI市場推出的芯片產品,除了算力的堆砌,往往都采用3D堆疊和先進封裝等方式,增加數據傳輸的效率,這與APU的優勢不謀而合。
英特爾尚未正式發布的Falcon Shores,同樣采用了將CPU、GPU、內存封裝在一起的思路,只不過英特爾將其稱為“XPU”。
但目前來看,最接近這個目標的反而是英偉達的Grace Hopper芯片。
英偉達的Grace Hopper將CPU和GPU集成在了一起
尾聲
在2009年APU的概念被提出時,AMD正經歷公司歷史上的最低谷,APU多少有些畢功一役的憋大招成分。
但也正是因為處于低谷,導致AMD無法拿出足夠的資金與技術支持,讓APU的革命性理念真正落地,最終只變成了簡單的CPU+GPU的組合。
從商業角度看,最適合在2009年搞點革命性產品的反而是富可敵國的英特爾,但英特爾當時在干什么呢——心安理得的擠牙膏,同時拒絕為iPhone設計芯片。
這似乎是高科技公司常常會出現的狀況——在鼎盛年代忽視新的技術浪潮,在低谷期如夢方醒倉促憋大招。
事實上,英特爾還嘗試過“聯A抗N”——2017年,英特爾宣布將在自家CPU上集成AMD的GPU,合作推出新的芯片。
結果沒過多久,英特爾就挖走了AMD的核心技術負責人之一:圖形主管Raja Koduri,為英特爾開發高端獨立GPU。
審核編輯:劉清
-
處理器
+關注
關注
68文章
20250瀏覽量
252225 -
amd
+關注
關注
25文章
5683瀏覽量
139943 -
英特爾
+關注
關注
61文章
10301瀏覽量
180430 -
AI芯片
+關注
關注
17文章
2126瀏覽量
36771
原文標題:AMD的翻身仗
文章出處:【微信號:Smart6500781,微信公眾號:SEMIEXPO半導體】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
Robotec.ai與AMD Silo AI的合作實踐
使用Aurora 6466b協議實現AMD UltraScale+ FPGA與AMD Versal自適應SoC的對接
AMD Power Design Manager 2025.2版本現已發布
AMD Vivado Design Suite 2025.2版本現已發布
AMD Vitis AI 5.1測試版發布
AMD Vivado IP integrator的基本功能特性
鴻蒙 PC 震撼登場!華為打破 Windows 壟斷!
AMD Power Design Manager 2025.1現已推出
AMD FPGA異步模式與同步模式的對比
使用AMD Vitis Unified IDE創建HLS組件
AMD Vivado Design Suite 2025.1現已推出
如何使用AMD Vitis HLS創建HLS IP
AMD的翻身仗
評論