電子發燒友網報道(文/周凱揚)要說RISC-V社區最炙手可熱的AI芯片初創公司,除了Ventana和Tenstorrent的話,當屬打造出千核RISC-V芯片ET-SoC-1的Esperanto了。近日,Esperanto公開了他們在AI軟件生態上所做的進一步努力,也透露了下一代千核RISC-V芯片的部分細節。
下一代千核RISC-V處理器結合HPC和ML
ET-SoC-1作為專門用于機器學習,尤其是推薦系統這類AI負載的RISC-V處理器,采用臺積電7nm工藝打造,集成了1092個低功耗RISC-V核心。這上千個RISC-V核心中包括1088個ET-Minion核心,用于ML應用的計算,而另外4個ET-Maxion核心則提供更高的單線程性能,用于運行操作系統等任務。
根據ET-Minion工作頻率的不同,ET-SoC-1的峰值算力在100到200TOPS之間,大多數負載下功耗甚至不會超過20W,不過單個PCIe模塊由于集成了DRAM等組件,還是會達到30多瓦的功耗,可這已經是很優異的表現了。
但ET-SoC-1畢竟從一開始就是為了ML這種低精度運算的應用而設計的,至于多數利用雙精度計算的HPC領域,ET-SoC-1是沒辦法打入這一市場的。為此,Esperanto計劃打破CPU+GPU或CPU+其他加速器的現狀,讓RISC-V芯片從HPC和ML兩個方向同時下手,這一解決方案正是他們尚在研發的ET-SoC-2處理器。
ET-SoC-1已經證明了RISC-V非常適合用于機器學習,而ET-SoC-2則打算同時攻克HPC計算。據Esperanto所述,ET-SoC-2的目標是除了支持FP16/FP8外,還要引入對FP64/FP32高精度的支持,并實現10Tflops以上的FP64算力。
為此他們將采用更為先進的半導體工藝,以及全新的HBM內存,同時還要進一步提高擴展性,可以將大量芯片無縫組合在一起,共享龐大的內存與計算資源。即便有了如此強勁的性能,Esperanto依然將低功耗作為設計目標之一,其表示未來五年內,基于RISC-V的超算系統一定會在Green500這一能效榜單上名列前茅。
軟件生態仍需努力
即便芯片設計中RISC-V在算力上能與其他GPU、AI加速器媲美,但沒有軟件生態的支持是遠遠不夠的。屆時必將面臨絕大多數新AI芯片橫亙在眼前的問題,那就是開發者更愿意去選擇軟件生態成熟度更高的GPU。
所以Esperanto也已經開始了加速其芯片的軟件支持,比如將Meta的LLM移植到ET-SoC-1上。同時Esperanto也推出了針對ET-SoC-1的通用SDK,允許開發者對1024個ET-Minion核心并行編程。但這些努力也只能算是走出了第一步而已,對于服務器這個通用性稱王的市場,如果沒辦法運行大部分主流的AI模型,客戶借助該硬件打造應用程序的意愿也會大大降低。
這也就是為何大部分AI初創公司也要建立規模不小軟件團隊的原因,除了需要支持和優化主流AI模型與框架外,還需要對部分服務器軟件進行移植。跨不過這個門檻的話,始終難以邁進主流市場。
寫在最后
最近另一家RISC-V AI芯片初創公司Tenstorrent,也從現代、起亞和三星這一眾韓國廠商那拿到了1億美元的投資。由此可以看出,AI芯片會是RISC-V開發的下一個大方向,無論是汽車芯片,還是數據中心加速器,都會進一步推動RISC-V在AI擴展指令上的標準化加速。
下一代千核RISC-V處理器結合HPC和ML
ET-SoC-1作為專門用于機器學習,尤其是推薦系統這類AI負載的RISC-V處理器,采用臺積電7nm工藝打造,集成了1092個低功耗RISC-V核心。這上千個RISC-V核心中包括1088個ET-Minion核心,用于ML應用的計算,而另外4個ET-Maxion核心則提供更高的單線程性能,用于運行操作系統等任務。
根據ET-Minion工作頻率的不同,ET-SoC-1的峰值算力在100到200TOPS之間,大多數負載下功耗甚至不會超過20W,不過單個PCIe模塊由于集成了DRAM等組件,還是會達到30多瓦的功耗,可這已經是很優異的表現了。
但ET-SoC-1畢竟從一開始就是為了ML這種低精度運算的應用而設計的,至于多數利用雙精度計算的HPC領域,ET-SoC-1是沒辦法打入這一市場的。為此,Esperanto計劃打破CPU+GPU或CPU+其他加速器的現狀,讓RISC-V芯片從HPC和ML兩個方向同時下手,這一解決方案正是他們尚在研發的ET-SoC-2處理器。
ET-SoC-1已經證明了RISC-V非常適合用于機器學習,而ET-SoC-2則打算同時攻克HPC計算。據Esperanto所述,ET-SoC-2的目標是除了支持FP16/FP8外,還要引入對FP64/FP32高精度的支持,并實現10Tflops以上的FP64算力。
為此他們將采用更為先進的半導體工藝,以及全新的HBM內存,同時還要進一步提高擴展性,可以將大量芯片無縫組合在一起,共享龐大的內存與計算資源。即便有了如此強勁的性能,Esperanto依然將低功耗作為設計目標之一,其表示未來五年內,基于RISC-V的超算系統一定會在Green500這一能效榜單上名列前茅。
軟件生態仍需努力
即便芯片設計中RISC-V在算力上能與其他GPU、AI加速器媲美,但沒有軟件生態的支持是遠遠不夠的。屆時必將面臨絕大多數新AI芯片橫亙在眼前的問題,那就是開發者更愿意去選擇軟件生態成熟度更高的GPU。
所以Esperanto也已經開始了加速其芯片的軟件支持,比如將Meta的LLM移植到ET-SoC-1上。同時Esperanto也推出了針對ET-SoC-1的通用SDK,允許開發者對1024個ET-Minion核心并行編程。但這些努力也只能算是走出了第一步而已,對于服務器這個通用性稱王的市場,如果沒辦法運行大部分主流的AI模型,客戶借助該硬件打造應用程序的意愿也會大大降低。
這也就是為何大部分AI初創公司也要建立規模不小軟件團隊的原因,除了需要支持和優化主流AI模型與框架外,還需要對部分服務器軟件進行移植。跨不過這個門檻的話,始終難以邁進主流市場。
寫在最后
最近另一家RISC-V AI芯片初創公司Tenstorrent,也從現代、起亞和三星這一眾韓國廠商那拿到了1億美元的投資。由此可以看出,AI芯片會是RISC-V開發的下一個大方向,無論是汽車芯片,還是數據中心加速器,都會進一步推動RISC-V在AI擴展指令上的標準化加速。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
RISC-V
+關注
關注
48文章
2886瀏覽量
52991
發布評論請先 登錄
相關推薦
熱點推薦
Banana Pi BPI-CM6 計算模塊將 8 核 RISC-V 處理器帶入 CM4 外形尺寸
RISC-V 處理器設計,而非封閉的 ARM 架構,是邁向開放式架構計算的真正一步。這為開發者提供了更大的自由度、靈活性和長期發展空間,并讓他們能夠訪問開放的指令集。它將 GPU、AI 加速
發表于 12-20 09:01
重磅合作!Quintauris 聯手 SiFive,加速 RISC-V 在嵌入式與 AI 領域落地
SoC 開發流程,幫開發者省時間;
優化下一代 RISC-V 設計的性能和能效,進一步拉高性能上限;
把 RISC-V 打造成能和傳統專有處理器
發表于 12-18 12:01
d-Matrix與Andes晶心科技合作打造下一代AI推理加速器
數據中心生成式 AI 推理計算的先驅 d-Matrix,以及高效率、低功耗 RISC-V 處理器核心的領先供應商、RISC-V 國際協會的創始首席會員 Andes 晶心科技 (Andes
銳能微RISC-V雙核MCU芯片在智能電表中的應用
上海貝嶺股份有限公司全資子公司深圳市銳能微科技有限公司近日推出了電表行業首顆RISC-V雙核MCU芯片。該芯片主要面向出口電表市場,同時也為國網及南網
Andes晶心科技推出新一代深度學習加速器
高效能、低功耗 32/64 位 RISC-V 處理器核與 AI 加速解決方案的領導供貨商—Andes晶心科技(Andes Technology)今日正式發表最新深度學習
RISC-V 的平臺思維和生態思維
RISC-V 的平臺思維時指出,平臺思維指的是硬件(CPU、加速器、總線等)、固件和軟件的整體集成。標準化 ISA 配置文件是必要的
發表于 07-17 14:04
?4186次閱讀
思爾芯攜手Andes晶心科技,加速先進RISC-V 芯片開發
在RISC-V生態快速發展和應用場景不斷拓展的背景下,芯片設計正面臨前所未有的復雜度挑戰。近日,RISC-V處理器核領先廠商Andes晶心科
RISC-V賽道的“硬核”突圍之路
RISC-V作為一種開源指令集架構(ISA),近年來在全球范圍內迅速崛起,有望重塑半導體產業格局。從芯片設計公司到軟件開發商,從學術研究機構到行業巨頭,都在積極探索
RISC-V核低功耗MCU指令集架構(ISA)特點
RISC-V核低功耗MCU通過開源生態、模塊化架構與能效優化技術,成為物聯網、穿戴設備等領域的理想選擇?。 一、?開源與可定制性? 完全開源免費?:RISC-V ISA無需專利授權費用
FPGA與RISC-V淺談
RISC-V處理器的SoC數量在2024年約為20億顆,到2031年有望突破200億顆。 RISC-V的概念與優勢 RISC-V是一種全新的
發表于 04-11 13:53
?672次閱讀
改變加速器格局,下一代千核RISC-V芯片
評論