国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AMD與Nvidia的人工智能芯片之戰

SSDFans ? 來源:hpcwire ? 2024-01-16 11:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AMD和Nvidia陷入了一場人工智能性能之戰——就像兩家公司幾十年來在游戲GPU性能上的競爭一樣。

AMD聲稱其新的Instinct MI300X GPU是世界上最快的人工智能芯片,擊敗了Nvidia炙手可熱的H100和即將推出的H200 GPU。AMDCEO Lisa Su最近在一個人工智能活動上發表演講時表示:“這是世界上性能最高的生成式人工智能加速器。”

這標志著MI300X的正式推出,它是MI300A的一個更強大的版本,將用于Lawrence Livermore國家實驗室建造的代號為El Capitan的200億次超級計算機。

MI300X基于CDNA3架構,可為FP16和BFLoat16等關鍵AI數據類型提供三倍以上的性能。該芯片有1530億個晶體管,采用3D封裝;內部使用了5納米和6納米工藝制造的芯片模塊。該芯片擁有304個GPU計算單元,192GB HBM3內存,5.3 TB/s內存帶寬。

MI300X的峰值FP32性能為163.4 teraflops,峰值FP64性能為81.7 teraflops。上一代MI250X的峰值單精度(FP32)矢量和雙精度(FP64)矢量性能為47.9 teraflops。AMD還將其芯片與H100的SXM版本進行了比較,Nvidia H100 SXM可提供68 teraflops的峰值FP32性能和34 teraflops的FP64性能。H100 NVL模型在性能上縮小了差距,可提供134teraflops的FP32性能和68teraflops的FP64性能。

Nvidia即將推出的H200是H100的內存升級版本,但內存和帶寬仍然比MI300X少。H200的GPU內存為141GB,帶寬為4.8TB/s。

“對于MI300X,我們增加了更大的靈活性、更大的內存容量和更大的帶寬。這意味著它的內存容量是競爭對手的2.4倍,內存帶寬是1.6倍。”Su將MI300X與Nvidia的H100 SXM型號進行了比較,后者具有80GB的HBM內存和3.35TB/s的內存帶寬。two-pieceH100 NVL型號的HBM3內存為188GB,但內存帶寬為7.8TB/s,超過了MI300X。

AMD能保持這個頭銜多久還有待觀察。Nvidia正計劃對其芯片進行年度升級,新的B100 GPU將于2024年推出,X100 GPU將于2025年推出。

AMD在短短一年的時間里取得了長足的進步。一年前,當ChatGPT出現時,AMD措手不及。聊天機器人推動Nvidia成長為一家價值數萬億美元的公司,A100和H100 GPU成為最熱門的科技資產。

GPT-4背后的Nvidia硬件憑借一己之力推動了人工智能的采用,并且仍然是無可爭議的人工智能冠軍。但Nvidia的硬件短缺促使客戶尋找替代品,并為AMD提供了一個展示其最新GPU和系統的機會,成為一個可行的替代品。除了Nvidia,AMD在市場上也有很多機會。

Su表示:“我們現在預計,數據中心加速器TAM在未來四年中將以每年超過70%的速度增長,到2027年將超過4000億美元。”

MI300X芯片有1530億個晶體管,有12個5納米和6納米芯片。“它使用了世界上最先進的封裝。”MI300X在基礎層有四個IO芯片。每個IO芯片都有256兆字節的 Infinity Cache 和下一代IO,如128通道HBM3接口,支持PCIe Gen5,以及連接多個MI300X的第四代Infinity Fabric。該芯片在IO芯片上堆疊了8個CDNA3加速器小芯片。304個計算單元通過密集的TSV連接。支持高達每秒17TB的帶寬。該芯片連接了8層HBM3,總共有192GB的內存和5.3 TB/s的帶寬。

云供應商微軟、甲骨文和Meta已經在他們的云基礎設施中部署了MI300X GPU,盡管這些公司的人工智能能力主要還是來自Nvidia的芯片。提供人工智能替代方案的云供應商是很普遍的,如亞馬遜提供了各種選擇,包括其新發布的Trainium2芯片和英特爾的Gaudi處理器。其意圖也很明確:讓客戶有更多的選擇,不必屈服于NvidiaH100芯片的天價。

微軟CEO Kevin Scott在AMD活動臺上表示:“現在看到GPT-4在MI300X上的應用,看到Llama的表現,并讓它投入生產,令人非常興奮。”甲骨文云也將MI300X放入其云服務中。它還與Naveen Rao等早期采用者合作,后者的人工智能服務公司MosaicML最近被Databricks以13億美元收購。

據HPCwire報道,一家新的云服務公司TensorWave將在2024年推出一種新的可擴展和適應性強的GPU架構。基于GigaIO FabreX可組合PCIe技術,TensorNODE系統將支持多達5,760個Instinct MI300X GPU,并為所有GPU提供單個FabreX內存結構域。

AMD緊隨Nvidia的腳步,也宣布了自己的服務器架構,展示了一個兼容開放計算項目的服務器設計,其中包含8個MI300X GPU,這些GPU通過Infinity Fabric相互連接。該板可以放入任何兼容OCP的開放藍圖中,客戶可以在其上構建服務器。

“我們這么做是經過深思熟慮的。我們想讓客戶盡可能容易地采用它,這樣你就可以把主板拿出來,放入MI300X Instinct平臺。”這樣的系統建造起來會更便宜,讓客戶可以靈活地以最優惠的價格購買硬件。與Nvidia相比,這是一種截然不同的方法,Nvidia的HGX系統基于專有架構,成本很高。

AMD讓MI300X兼容OCP的計劃已經取得了成效,Meta快速部署了帶有該GPU的服務器。Meta高級工程總監Ajit Mathews表示:“MI300X利用了OCP模塊、標準和平臺,這有助于我們極短的時間內采用它。事實上,MI300X是Meta歷史上最快的部署解決方案之一。”

AMD對硬件的關注破壞了該公司的人工智能軟件戰略,該戰略落后于提供CUDA開發框架的Nvidia。CUDA的支持幫助推動了NvidiaGPU的廣泛采用。

該公司即將發布下一代ROCm 6,并聲稱具有新的功能和性能優勢。開發者George Hotz曾批評AMD缺乏軟件支持、文檔以及對GPU開發者的支持回應。AMD總裁彭于平表示,與上一代版本相比,ROCm 6的MI300X性能提高了8倍。

對于具有700億個參數的大型語言模型,ROCm6比MI300X快8倍,比MI250快8倍。ROCm 6框架將支持新的數據類型,包括FP16,這將提高性能并開放內存資源和帶寬。該框架還將進行許多低層次優化,以獲得更好的AI性能。

審核編輯:黃飛

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • amd
    amd
    +關注

    關注

    25

    文章

    5684

    瀏覽量

    139976
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109751
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135467
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265411
  • ChatGPT
    +關注

    關注

    31

    文章

    1598

    瀏覽量

    10269

原文標題:AMD MI300X GPU能否擊敗Nvidia H200?

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    淺談人工智能(2)

    接前文《淺談人工智能(1)》。 (5)什么是弱人工智能、強人工智能以及超人工智能? 弱人工智能(Weak AI),也稱限制領域
    的頭像 發表于 02-22 08:24 ?124次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    自然智能與人工智能融合如何重塑芯片設計

    人類大腦是所有處理器中最復雜的,能夠構思出不可思議的創意,解決復雜、微妙的問題。相比之下,人工智能擅長快速分析海量數據并高效執行任務。當自然智能人工智能融合的結果,就是芯片設計領域正
    的頭像 發表于 01-15 13:58 ?513次閱讀

    Magna AI加入NVIDIA Inception計劃,推動生產級人工智能規模化發展

    Magna AI是一家由Trend Micro與Wistron的戰略合作成立的全球全價值鏈人工智能轉型領導者。公司今日宣布,已加入NVIDIA Inception計劃,躋身全球率先實現生產級規模化
    的頭像 發表于 01-12 15:46 ?172次閱讀

    嵌入式系統中的人工智能

    本文編譯自ElectronicDesign人工智能(AI)正徹底變革嵌入式系統,改變技術融入日常生活的方式。如今的人工智能不再局限于執行基礎任務,它還被應用于智能汽車、工業自動化、醫療設備和
    的頭像 發表于 12-18 11:49 ?1037次閱讀
    嵌入式系統中<b class='flag-5'>的人工智能</b>

    人工智能+消費:技術賦能與芯片驅動未來

    電子發燒友網站提供《人工智能+消費:技術賦能與芯片驅動未來.pptx》資料免費下載
    發表于 11-26 14:50 ?34次下載

    AMD攜全棧式AI解決方案亮相進博會,賦能人工智能+

    2025年11月5日,上海: 第八屆中國國際進口博覽會在上海正式啟幕。作為全球高性能與自適應計算領導者,AMD連續五年亮相進博會。今年,以“AMD賦能人工智能+”為主題,AMD全面展示
    的頭像 發表于 11-06 12:53 ?279次閱讀
    <b class='flag-5'>AMD</b>攜全棧式AI解決方案亮相進博會,賦能<b class='flag-5'>人工智能</b>+

    Lambda采用Supermicro NVIDIA Blackwell GPU服務器集群構建人工智能工廠

    大批量 Supermicro GPU 優化服務器(包括基于 NVIDIA Blackwell 的系統),以擴展其人工智能基礎設施并向客戶交付高性能計算系統。此次合作于今年 6 月率先在俄亥俄州哥倫布市的 Cologix COL4 ScalelogixSM 數據中心啟動,為
    的頭像 發表于 08-30 16:55 ?780次閱讀

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    的深度學習,構建起從基礎到前沿的完整知識體系,一門實驗箱就能滿足多門課程的學習實踐需求,既節省經費又不占地 。 五、代碼全開源,學習底層算法 所有實驗全部開源,這對于想要深入學習人工智能技術的人來說
    發表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    的深度學習,構建起從基礎到前沿的完整知識體系,一門實驗箱就能滿足多門課程的學習實踐需求,既節省經費又不占地 。 五、代碼全開源,學習底層算法 所有實驗全部開源,這對于想要深入學習人工智能技術的人來說
    發表于 08-07 14:23

    關于人工智能處理器的11個誤解

    應用,以及哪些是真實情況而哪些只是炒作,仍存在諸多誤解。GPU是最佳的人工智能處理器盡管GPU在人工智能的實現過程中發揮了關鍵作用,而且如今它們的應用也極為廣泛,但將其推
    的頭像 發表于 08-07 13:21 ?1071次閱讀
    關于<b class='flag-5'>人工智能</b>處理器的11個誤解

    壁仞科技榮獲WAIC 2025卓越人工智能引領者獎

    近日,2025世界人工智能大會暨人工智能全球治理高級別會議(WAIC 2025)主論壇上,備受矚目的人工智能界“奧斯卡”正式揭曉。由曦智科技、壁仞科技、中興通訊聯合打造的“分布式OCS全光互連
    的頭像 發表于 08-01 15:19 ?1824次閱讀

    超小型Neuton機器學習模型, 在任何系統級芯片(SoC)上解鎖邊緣人工智能應用.

    Neuton 是一家邊緣AI 公司,致力于讓機器 學習模型更易于使用。它創建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們將介紹
    發表于 07-31 11:38

    最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發展的當下,無論是探索未來職業方向,還是更新技術儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學術研究的智能工具,大模型正在工作生活
    發表于 07-04 11:10

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網,WiFi,USB 擴展/重力感應/RS232/RS485/IO 擴展/I2C 擴展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個全新八核擁有超強性能的人工智能
    發表于 04-23 10:55

    Cognizant將與NVIDIA合作部署神經人工智能平臺,加速企業人工智能應用

    -Cognizant將與NVIDIA合作部署神經人工智能平臺,加速企業人工智能應用 Cognizant將在關鍵增長領域提供解決方案,包括企業級AI智能體、定制化行業大型語言模型及搭載
    的頭像 發表于 03-26 14:42 ?744次閱讀
    Cognizant將與<b class='flag-5'>NVIDIA</b>合作部署神經<b class='flag-5'>人工智能</b>平臺,加速企業<b class='flag-5'>人工智能</b>應用