AMD將于今年秋季在部分RDNA 3 GPU上添加ROCm的支持
人工智能是塑造下一代計算的決定性技術(shù)。近幾個月來,我們都看到了生成式人工智能和大語言模型的爆炸式增長正在徹底改變我們與技術(shù)交互的方式,并推動以GPU為中心的數(shù)據(jù)中心對高性能計算的需求顯著增加。
ROCm是一個開放軟件平臺,允許研究人員利用AMD Instinct加速器的強大功能,促進HPC和AI創(chuàng)新跨平臺的可移植性。ROCm 5具有針對AI和HPC工作負載的全面優(yōu)化套件。其中包括針對大型語言模型精細調(diào)整的內(nèi)核、對新數(shù)據(jù)類型的支持以及對像OpenAI Triton類編程語言等新技術(shù)的支持。
ROCm驗證現(xiàn)在包括每晚進行數(shù)十萬次框架測試,以及跨數(shù)千個模型和運算符的驗證。這包括對PyTorch、TensorFlow、ONNX和JAX等領(lǐng)先框架的支持,為基于這些框架構(gòu)建的所有AI模型提供更佳的開箱即用的開發(fā)者體驗。
我很高興地宣布ROCm 5.6的最新版本。
ROCm 5.6通過針對大語言(和其他)模型的新型AI軟件附加組件增強了功能,包括跨ROCm 庫組合的許多性能優(yōu)化。它還反映了支持人工智能社區(qū)的持續(xù)改進,包括:
- 將Hugging Face單元測試套件集成到ROCm QA中
- 在PyTorch 2.0感應器模式下對OpenAI Triton的增量支持
- 通過ROCm對PyTorch、TensorFlow和JAX啟用OpenXLA支持,從而支持更廣泛的社區(qū)
ROCm 5.6還引入了對FFT、BLAS和求解器等多個數(shù)學庫的改進,這些數(shù)學庫構(gòu)成了HPC應用程序的基礎(chǔ),并增強了ROCm開發(fā)和部署工具,包括安裝、ROCgdb(CPU-GPU集成調(diào)試器)、ROCm分析器和文檔。
隨著行業(yè)朝著支持廣泛加速器的開放生態(tài)系統(tǒng)發(fā)展,我們將繼續(xù)努力進一步優(yōu)化框架和后端編譯器,以實現(xiàn)更佳性能,包括MLIR基礎(chǔ)設(shè)施改進,鞏固AMD對OpenAI Triton和OpenXLA編譯器的支持。我們還將繼續(xù)在Hugging Face的AMD hub中添加針對AMD解決方案優(yōu)化的其他開源AI模型。
對于HPC用戶,我們最近在AMD Infinity Hub上發(fā)布了許多發(fā)布方法,使客戶能夠構(gòu)建HPC應用程序容器,未來的ROCm版本將增加AMD Instinct解決方案支持的HPC應用程序數(shù)量。
我們還看到開發(fā)人員對在Radeon消費級和 Radeon Pro工作站級GPU上運行用于AI和ML的ROCm開放軟件平臺表現(xiàn)出了極大的興趣,并聽到了社區(qū)對不受支持的GPU上的特定驅(qū)動程序問題提出的挑戰(zhàn)。我可以很高興地說,我們已經(jīng)修復了ROCm 5.6中報告的問題,并且我們致力于今后擴大我們的支持。
我們計劃將ROCm支持從當前支持的AMD RDNA 2工作站GPU:Radeon Pro v620和w6800 擴展到特定的AMD RDNA 3工作站和消費級GPU。Linux上對基于RDNA 3的GPU的正式支持計劃于今年秋季開始推出,首先是48GB Radeon PRO W7900和24GB Radeon RX 7900 XTX,隨著時間的推移,還會發(fā)布更多卡和擴展功能。
責任編輯:彭菁
-
amd
+關(guān)注
關(guān)注
25文章
5678瀏覽量
139708 -
人工智能
+關(guān)注
關(guān)注
1815文章
50053瀏覽量
264526 -
RDNA
+關(guān)注
關(guān)注
0文章
22瀏覽量
2228
原文標題:新的ROCm? 5.6版本為AI和HPC工作負載帶來增強和優(yōu)化
文章出處:【微信號:AMD中國,微信公眾號:AMD中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
解析ISL62776:AMD CPU/GPU核心電源的理想之選
Robotec.ai與AMD Silo AI的合作實踐
用ROCm部署PP-StructureV3到AMD GPU上
Imagination GPU 全面支持 Vulkan 1.4 和 Android 16
aicube的n卡gpu索引該如何添加?
產(chǎn)品添加與上架API接口設(shè)計指南
ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀元!代碼已經(jīng)開源,一起來試試!
為什么無法在GPU上使用INT8 和 INT4量化模型獲得輸出?
英偉達擬再推中國特供GPU,今年6月量產(chǎn)!
如何通過SFL為設(shè)備添加Flash編程支持
摩爾線程GPU率先支持Qwen3全系列模型
專訪AMD王啟尚 從RDNA 4到FSR 4,AMD GPU技術(shù)創(chuàng)新引領(lǐng)行業(yè)新發(fā)展
專訪AMD GPU教父王啟尚:卓越的RDNA 4架構(gòu),造就新一代性價比王者顯卡
AMD將于今年秋季在部分RDNA 3 GPU上添加ROCm的支持
評論