據(jù)最新消息,自 AMD 去年 12 月份公布 ROCm 6.0 以來,已經(jīng)開始積極籌備 6.1 版的發(fā)布,以提高與英偉達(dá)(NVIDIA)CUDA 競(jìng)爭(zhēng)的核心實(shí)力。
在此期間,AMD 頻繁向GitHub公共倉庫推送有關(guān) ROCm 6.1 的最新開發(fā)進(jìn)展,透露出不久后有可能正式上線新版本的意圖。
據(jù)悉,此次 ROCm 6.1 主要的突破在于其升級(jí)至全新版本的 MIPOpen 3.1;新增了使用AI進(jìn)行參數(shù)預(yù)測(cè)的 conv_hip_igemm_group_fwd_xdlops 求解器;解決了當(dāng)前版本的眾多 BUG,以及引入了新的求解器算法。
此外,該系列還努力提升了系統(tǒng)性能,尤其是優(yōu)化了MIGraphX功能,包含但不限于加入對(duì)FP8精度的支持,以及增加更多運(yùn)算符等,同時(shí)更新了針對(duì) Whisper / Llama-2 / Stable Diffusion 2.1 的文檔示例,以及提供新的ONNX示例,以便更好地適應(yīng) GEMM 的BLAS自動(dòng)調(diào)整。
更重要的是,為了改善在Microsoft Windows 環(huán)境下運(yùn)行 MIGraphX的效率,AMD特別推出了全新的“hipother”資源庫。
值得一提的是,HIP 技術(shù)是AMD專有的C++運(yùn)行時(shí)API和內(nèi)核語言,適配可移植的AMD/NVIDIA GPU應(yīng)用程序,而HIPIFY 工具則能協(xié)助將CUDA源碼便捷地轉(zhuǎn)化成HIP腳本。
-
amd
+關(guān)注
關(guān)注
25文章
5678瀏覽量
139711 -
英偉達(dá)
+關(guān)注
關(guān)注
23文章
4076瀏覽量
98976 -
求解器
+關(guān)注
關(guān)注
0文章
85瀏覽量
4923
發(fā)布評(píng)論請(qǐng)先 登錄
使用NORDIC AI的好處
Robotec.ai與AMD Silo AI的合作實(shí)踐
用ROCm部署PP-StructureV3到AMD GPU上
AMD Vitis AI 5.1測(cè)試版發(fā)布
明遠(yuǎn)智睿RK3568核心板如何助力工業(yè)4.0升級(jí)
Cognizant加速AI模型企業(yè)級(jí)開發(fā)
ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀(jì)元!代碼已經(jīng)開源,一起來試試!
JDK從8升級(jí)到21的問題集
首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
6.12.1升級(jí)到6.13老是閃退是什么原因?qū)е碌模?/a>
FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......
啟明智顯集成DeepSeek、豆包、OpenAI等全球先進(jìn)AI大模型,助力傳統(tǒng)產(chǎn)品AI智能升級(jí)
AMD ROCm 6.1升級(jí)MIPOpen 3.1,引入AI參數(shù)預(yù)測(cè)模型
評(píng)論