AMD在本周的SC20虛擬會議上,推出了基于他們CDNA架構(gòu)的AMD Instinct MI100加速器。另外值得注意的是,與MI100發(fā)布同時進(jìn)行的還有Radeon Open eCosystem 4.0(ROCm 4.0)Linux版本。AMD認(rèn)為MI100是世界上最快的HPC GPU加速器,提供超過10TFLOPS的FP64計算能力。MI100額定峰值FP64性能為11.5 TFLOPS,F(xiàn)P32矩陣性能高達(dá)46.1 TFLOPS。與上一代AMD加速器相比,搭配AMD矩陣核心技術(shù)的MI100在人工智能訓(xùn)練方面的FP16峰值性能提升近7倍。
AMD Instinct MI100內(nèi)建32GB HBM2內(nèi)存,工作頻率1.2GHz,內(nèi)存帶寬為1.23TB/s。MI100支持PCI Express 4.0連接,內(nèi)建120個計算單元和7680個流處理器。CDNA是Vega架構(gòu)演化版本,而不是針對游戲優(yōu)化的RDNA/Navi架構(gòu),考慮到HPC的重點(diǎn)和我們看到Arcturus Linux補(bǔ)丁成熟的時間,AMD Instinct MI100支持的Linux支持應(yīng)該是很好的推出狀態(tài),盡管我們還沒能測試加速器以確認(rèn)其Linux支持狀態(tài)。
AMD Instinct MI100使用32GB HBM2內(nèi)存,時鐘速率為1.2GHz,內(nèi)存帶寬為1.23TB/s。MI100支持PCI Express 4.0連接,可打包120個計算單元和7680個流處理器。CDNA是織女星結(jié)構(gòu)的進(jìn)化,而不是游戲優(yōu)化而不是計算的RDNA/Navi。考慮到AMD對HPC的關(guān)注以及Arcturus Linux補(bǔ)丁準(zhǔn)備在即,AMD Instinct MI100應(yīng)該很好的支持到Linux。
這次推出的ROCm 4.0讓它比以往更容易更高效地將NVIDIA CUDA代碼庫移植到它上面。ROCm 4.0被宣傳為 “Exascale時代 ”的開源平臺,同時支持OpenMP 5.0行業(yè)標(biāo)準(zhǔn)及其HIP接口,以及PyTorch和Tensorflow框架等。ROCm進(jìn)化目的是讓開發(fā)者更容易部署和移植他們的軟件,使其運(yùn)行在這個開源計算棧上,而不是NVIDIA專有的 CUDA平臺。
AMD還在SC20虛擬會議上表示,EPYC “Zen 3 ”處理器本季度將批量提供給部分HPC和云計算客戶。AMD EPYC Zen 3 CPU將在2021年第一季度正式發(fā)布和上市。
責(zé)任編輯:haq
-
amd
+關(guān)注
關(guān)注
25文章
5677瀏覽量
139658 -
加速器
+關(guān)注
關(guān)注
2文章
839瀏覽量
39951 -
內(nèi)存
+關(guān)注
關(guān)注
9文章
3204瀏覽量
76287
發(fā)布評論請先 登錄
性能狂飆!AMD新品叫板英偉達(dá)GB200,角逐5000億AI加速器賽道
Robotec.ai與AMD Silo AI的合作實踐
AMD銳龍AI嵌入式P100系列處理器產(chǎn)品簡介
AMD獲部分MI 308對華出口許可,擬繳15%費(fèi)用破局地緣困局
用ROCm部署PP-StructureV3到AMD GPU上
0.9-4.0 GHz、100 W 高功率硅 PIN 二極管 SPDT 開關(guān) skyworksinc
浮思特 | 邁瑞迪MI1602紅外熱成像模塊,如何顛覆傳統(tǒng)溫度監(jiān)測
SCE-MI協(xié)議簡介
重磅!AMD將恢復(fù)向中國出口MI308芯片!
ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀(jì)元!代碼已經(jīng)開源,一起來試試!
AMD推出Instinct MI100和Radeon ROCm4.0
評論