電子發(fā)燒友網(wǎng)報道(文/梁浩斌)英偉達生態(tài)護城河CUDA,從最初支持x86、PowerCPU架構,到2019年宣布支持ArmCPU,不斷拓展在數(shù)據(jù)中心的應用生態(tài)。在2019年至今的六年時間里,RISC-V生態(tài)也在不斷壯大,RISC-VCPU產(chǎn)品性能持續(xù)提高,開始往高性能的服務器CPU發(fā)展,形成向Arm服務器CPU挑戰(zhàn)的趨勢。
而在最近的第五屆RISC-V中國峰會上,英偉達副總裁FransSijstermanns宣布了一則重磅消息:英偉達要將CUDA移植到RISC-V架構上。
英偉達每年出貨超10億顆RISC-VMCU
FransSijstermanns在峰會演講中指出,英偉達是RISC-V國際基金會(RVI)和RISC-V軟件生態(tài)系統(tǒng)聯(lián)盟(RISE)的董事會成員和技術委員會代表,并且是RISC-V規(guī)范的定期貢獻者。
實際上,英偉達使用RISC-V架構設計MCU已經(jīng)有10年時間。去年10月,英偉達披露了他們在RISC-V領域的歷史,早在2015年,英偉達就確立了RISC-V作為其GPU控制器的CPU架構。
根據(jù)去年英偉達公開的信息,目前英偉達已經(jīng)推出了至少三類RISC-V的MCU核心,包括NV-RISCV32(RV32I-MU指令集,順序單發(fā)射核心)、NV-RISCV64(RV64I-MSU指令集,亂序雙發(fā)射核心)、NV-RVV(NV-RISCV32增加向量運算能力)。
本次峰會上公開的資料顯示,英偉達RISC-V架構被集成到30多個IP中,每年出貨超過10億顆RISC-VMCU。
CUDA移植到RISC-V有哪些難題?
FransSijstermanns表示,CUDA是C語言和C++語言的拓展,是為了讓GPU運行速度更快、更高效。現(xiàn)在CUDA只在x86和ArmCPU上得以部署,但英偉達也正在向外界傳達一個信息——要將CUDA也移植到RISC-V架構上,“我相信這個未來是大有可為的”。
據(jù)介紹,CUDA的移植主要包含兩個部分,Toolkit工具箱和驅動程序。首先是CUDA編譯器和工具,比如NVCC、GDB、工具鏈等,這部分用于構建開發(fā)GPU加速應用程序的環(huán)境。另外還有CUDA庫,NVIDIANsight,以及驅動程序CUDAKMD和CUDAUMD。

在CUDA加速應用中,所有軟件都需要映射到目標CPU,包括應用特定的模塊、CUDA庫代碼、第三方軟件等,這些都需要重新移植到RISC-V處理器上,以支撐在RISC-V處理器上構建和部署應用程序。
其中,CUDA庫是非常重要的,在不同行業(yè)中都可能需要有專門的庫。比如物理模擬、計算光刻、量子計算、基因測序、數(shù)據(jù)處理、天氣分析等,不同行業(yè)和垂類都有相應的庫。通過CUDA庫中,針對英偉達GPU進行深度優(yōu)化的一系列函數(shù)集合,可以直接加速對應的計算任務,對于開發(fā)者來說,使用CUDA庫可以簡化開發(fā)流程,無需重頭編寫底層GPU代碼,只需要調(diào)用CUDA庫的API就可以實現(xiàn)并行計算。
據(jù)介紹,英偉達通過20多年的積累,已經(jīng)建立了900多個不同的庫,為多個行業(yè)的技術發(fā)展帶來極大加速。那么未來在CUDA成功移植到RISC-V后,就能夠使用RISC-VCPU+英偉達GPU來運行這些庫,為多種行業(yè)計算加速。
不過,F(xiàn)ransSijstermanns也提到,英偉達在將CUDA移植到RISC-VCPU的過程中,也遇到了問題。

首先,RISC-VCPU的板卡可用的選擇非常有限,目前英偉達主要基于SiFiveP550和阿里巴巴玄鐵C920進行開發(fā),性能還難以符合服務器需求;同時最新的RVA23配置文件和服務器SoC雖然已經(jīng)獲得批準,但目前還未有符合RVA32標準的高性能CPU板卡產(chǎn)品推出,現(xiàn)有產(chǎn)品在單核性能上也較弱。
RVA23是RVI在2024年10月批準的RVA配置文件規(guī)范,其中新增的關鍵強制性組件包括向量擴展和虛擬機管理程序擴展,解決了RISC-VCPU進行AI運算、操作系統(tǒng)和軟件工作負載等問題,有助于加速RISC-V軟件生態(tài)在工具鏈和操作系統(tǒng)中的廣泛實施。
其次,對于RISC-VCPU,可能需要統(tǒng)一虛擬內(nèi)存來加速CPU和GPU內(nèi)存之間的數(shù)據(jù)交換速度,以保證體驗一致性。
當然,在軟件方面,也還需要進一步的優(yōu)化,需要更高層次的應用堆棧,才能實現(xiàn)CUDA在RISC-V上的成熟運行。
目前英偉達也正在與RISC-V相關合作伙伴進行合作,著手CUDA的移植工作,未來一旦生態(tài)系統(tǒng)成熟,標準的CUDA版本將可以支持符合服務器平臺規(guī)范和運行Linux操作系統(tǒng)的RISC-V架構CPU。
RISC-V架構迎來里程碑?
不久前Arm放出豪言,預計到2025年年底,Arm在全球數(shù)據(jù)中心CPU的份額將會飆升至50%,而去年Arm的份額僅為15%。而回顧Arm在服務器CPU市場的發(fā)展,2019年可以稱得上是一個拐點。
自2019年英偉達宣布CUDA支持Arm架構CPU后,持續(xù)擴大對Arm生態(tài)的支持,在2023年宣布將CUDA全面擴展至Arm生態(tài),為Arm基礎設施提供完整的AI和HPC軟件堆棧,包括加速600多個HPC應用程序和所有AI框架。
Arm在服務器CPU市場的份額,也從2019年幾乎忽略不計,到2020年快速提升至接近3%;到2024年市場份額更是躍升至15%。當然,Arm市場份額的飆升也得益于頭部云計算服務商為了降低成本,集體轉向自研芯片的路線,變相推動了Arm生態(tài)在數(shù)據(jù)中心的應用。
那么對于目前的RISC-V架構而言,其相比Arm的主要優(yōu)勢在于,開放的指令集架構可以支持更多的定制化設計,廠商能夠更容易針對特定場景實現(xiàn)差異化的競爭力;授權費用更低,根據(jù)中國開放指令生態(tài)(RISC-V)聯(lián)盟秘書長包云崗的分享,以一款量產(chǎn)10萬顆的64核服務器CPU為例,開發(fā)成本約7.5億元人民幣,如果使用基于開源的聯(lián)合開發(fā)模式,比如RISC-V,可以降低2.5億元,也就是33%的研發(fā)費用。
業(yè)界普遍擔憂的是,RISC-V的開放特性可能會導致架構的碎片化。但CUDA對RISC-V的統(tǒng)一支持,未來能夠降低兼容門檻,有可能在部分細分市場復現(xiàn)Arm的成功路徑。
不過更重要的是,英偉達的加入,將為RISC-V產(chǎn)業(yè)注入新的信心,吸引更多玩家入局,從而加速高性能RISC-V服務器芯片的落地。
FransSijstermanns在最后也再次確定英偉達的立場:“其實我們不在乎CPU具體是什么,無論是x86、Arm或者是RISC-V,我們都能夠兼容。但是我們看中的一點是,就是要讓用戶和開發(fā)者有自己的選擇。CUDA能夠很好的幫助我們?nèi)ジ鶵ISC-V服務器借助英偉達GPU實現(xiàn)加速,并且更好地提出相關的全套硬件解決方案,這也是我們從軟件過渡到硬件的愿景。”
言下之意,當下RISC-V要在服務器領域有所建樹,還需要有足夠強大的RISC-VCPU去支撐用戶的需求。
-
RV
+關注
關注
0文章
8瀏覽量
9182 -
CUDA
+關注
關注
0文章
124瀏覽量
14376 -
英偉達
+關注
關注
23文章
4036瀏覽量
97533
發(fā)布評論請先 登錄
奧托立夫祝賀一汽大眾達成3000萬輛里程碑
深度數(shù)智亮相2025年RISC-V北美峰會,攜手共創(chuàng)開放式AI計算未來
RISC-V B擴展介紹及實現(xiàn)
大灣區(qū)RISC-V生態(tài)全景展示:RISC-V生態(tài)發(fā)展論壇、開發(fā)者Workshop和生態(tài)應用專區(qū)

RV生態(tài)又一里程碑:英偉達官宣CUDA將兼容RISC-V架構!
評論