談到如何設計AI加速器,許多工程師都會給出不同的答案,但歸根結底仍是在一顆先進制程的芯片上排列組合數十億個晶體管。然而當前超大規模的AI推理依然面臨著不少挑戰,比如成本和復雜度高居不下,傳統架構下的性能、功耗和可編程性無法滿足超大規模的要求等。初創公司Esperanto作為去年才開始冒頭的初創企業,卻打算用RISC-V來解決這一問題。
Esperanto創立于2014年,其董事長Dave Ditzel曾在英特爾負責下一代微處理器架構的設計。Esperanto的工作方向是基于RISC-V這一開放架構,開發高性能、高效率的計算方案。為此,他們打造了ET-SoC-1,一個千核的RISC-V處理器,也是他們開發的首個AI加速器。

ET-SoC-1 / Esperanto
ET-SoC-1的名字寓意并不是傳統的SoC,而是面向超大規模數據中心的“片上超級電腦”。它包含了近乎1100個RISC-V核心,近240億晶體管。需要指出的是,ET-SoC-1是一個AI推理加速器,并不是訓練加速器。
據CEO Art Swift介紹,該芯片采用了臺積電7nm制程,在特定的工作任務上,能耗效率提高可至100倍。ET-SoC-1在其他關鍵工作任務上,性能提升要遠高于傳統的CPU加GPU方案。比如在模擬測試中,用于推薦網絡時,其性能提升高達50倍,在圖像分類上,性能提升高達30倍。雖然這些暫時只是紙面測試參數,但這樣的性能和功耗無疑可以給AI客戶帶來很大的吸引力。
據了解,這一芯片直至2021年第二季度才正式流片,預計2022年早期才會開始量產。這是因為Esperanto花了很多時間在驗證上,作為一家初創公司,Esperanto采用了架構、硬件和軟件聯合設計的方式,這樣一來雖然節省了時間,卻也讓規格一直在持續變動。因此Esperanto在驗證團隊上投入了許多精力,也率先采用了新思的ZeBu FPGA仿真方案,以求減少查錯和除錯時間。

ET-SoC-1芯片架構 / Esperanto
ET-SoC-1用到了兩種Esperanto自研的RISC-V核心,分別是4個ET-Maxion(超標量亂序核)和1089個ET-Minion(順序多線程核心)。ET-Maxion是一顆可以運行Linux的大核心,核心頻率超過2GHz,作為ET-SoC-1的控制CPU,而ET-Minion則用于矩陣乘法等重度機器學習數據處理。
ET-Maxion作為核心頻率超過2GHz的10級流水線RISC-V核心,其實原本是伯克利大學Boom V2開源核心的的分支,但Esperanto對此進行了大刀闊斧的改進。在SPEC2006測試下,其性能已經超過了Cortex-A57,不過還是次于Cortex-A72以及SiFive最近公布的P550。
雖然是一個小核,但ET-Minion也是一個64位RISC-V核心。ET-SoC-1內,32個ET-Minion和4MB的L2 SRAM組成了“Minion Shire”,一共34個Shire采用Mesh的方式連接在一起,多出來的一個ET-Minion則用作服務處理器。Esperanto用這一千多個ET-Minion做到了強大的浮點性能,某些傳統加速器僅支持INT8運算,而ET-SoC-1在FP16或FP32上都能展現出不俗的優勢。

搭載6個ET-SoC-1的Glacier Point v2 / Esperanto
Art Swift提到,Facebook推出的開源AI板卡Glacier Point v2可以搭載6個ET-SoC-1芯片,這樣以來就可以直接接入已有的開源計算項目(OCP)設備中。這一張卡上就包含了6558個RISC-V核心和192GB的LPDDR4X DRAM,帶寬可達822GB/s的同時還擁有較低的功耗。據估計,這一設計的板卡峰值性能可達800 TOPS(INT8)以上。
在軟件層面上,Esperanto也為C++、Pytorch和TensorFlow常見的機器學習框架提供了支持。只需采用Facebook的開源編譯器,就可以在多個ET-SoC-1芯片上運行機器學習模型。
結語
RISC-V雖然在傳統的CPU與GPU市場還未徹底崛起,但在AI加速上,已經以其獨到的優勢迅速攻城略地。這種千核式的設計其實已經應用于Arm等架構,不少數據中心、超算卻依然在嘗試用RISC-V作為加速器。
RISC-V憑借其開放性、擴展性和自主性,并沒有像Arm那樣由低至高地發展市場,而是低端和高端兩頭抓,一旦消費市場也開始普及RISC-V生態,那時的RISC-V就有與Arm全市場爭霸的希望了。
Esperanto創立于2014年,其董事長Dave Ditzel曾在英特爾負責下一代微處理器架構的設計。Esperanto的工作方向是基于RISC-V這一開放架構,開發高性能、高效率的計算方案。為此,他們打造了ET-SoC-1,一個千核的RISC-V處理器,也是他們開發的首個AI加速器。

ET-SoC-1 / Esperanto
ET-SoC-1的名字寓意并不是傳統的SoC,而是面向超大規模數據中心的“片上超級電腦”。它包含了近乎1100個RISC-V核心,近240億晶體管。需要指出的是,ET-SoC-1是一個AI推理加速器,并不是訓練加速器。
據CEO Art Swift介紹,該芯片采用了臺積電7nm制程,在特定的工作任務上,能耗效率提高可至100倍。ET-SoC-1在其他關鍵工作任務上,性能提升要遠高于傳統的CPU加GPU方案。比如在模擬測試中,用于推薦網絡時,其性能提升高達50倍,在圖像分類上,性能提升高達30倍。雖然這些暫時只是紙面測試參數,但這樣的性能和功耗無疑可以給AI客戶帶來很大的吸引力。
據了解,這一芯片直至2021年第二季度才正式流片,預計2022年早期才會開始量產。這是因為Esperanto花了很多時間在驗證上,作為一家初創公司,Esperanto采用了架構、硬件和軟件聯合設計的方式,這樣一來雖然節省了時間,卻也讓規格一直在持續變動。因此Esperanto在驗證團隊上投入了許多精力,也率先采用了新思的ZeBu FPGA仿真方案,以求減少查錯和除錯時間。

ET-SoC-1芯片架構 / Esperanto
ET-SoC-1用到了兩種Esperanto自研的RISC-V核心,分別是4個ET-Maxion(超標量亂序核)和1089個ET-Minion(順序多線程核心)。ET-Maxion是一顆可以運行Linux的大核心,核心頻率超過2GHz,作為ET-SoC-1的控制CPU,而ET-Minion則用于矩陣乘法等重度機器學習數據處理。
ET-Maxion作為核心頻率超過2GHz的10級流水線RISC-V核心,其實原本是伯克利大學Boom V2開源核心的的分支,但Esperanto對此進行了大刀闊斧的改進。在SPEC2006測試下,其性能已經超過了Cortex-A57,不過還是次于Cortex-A72以及SiFive最近公布的P550。
雖然是一個小核,但ET-Minion也是一個64位RISC-V核心。ET-SoC-1內,32個ET-Minion和4MB的L2 SRAM組成了“Minion Shire”,一共34個Shire采用Mesh的方式連接在一起,多出來的一個ET-Minion則用作服務處理器。Esperanto用這一千多個ET-Minion做到了強大的浮點性能,某些傳統加速器僅支持INT8運算,而ET-SoC-1在FP16或FP32上都能展現出不俗的優勢。

搭載6個ET-SoC-1的Glacier Point v2 / Esperanto
Art Swift提到,Facebook推出的開源AI板卡Glacier Point v2可以搭載6個ET-SoC-1芯片,這樣以來就可以直接接入已有的開源計算項目(OCP)設備中。這一張卡上就包含了6558個RISC-V核心和192GB的LPDDR4X DRAM,帶寬可達822GB/s的同時還擁有較低的功耗。據估計,這一設計的板卡峰值性能可達800 TOPS(INT8)以上。
在軟件層面上,Esperanto也為C++、Pytorch和TensorFlow常見的機器學習框架提供了支持。只需采用Facebook的開源編譯器,就可以在多個ET-SoC-1芯片上運行機器學習模型。
結語
RISC-V雖然在傳統的CPU與GPU市場還未徹底崛起,但在AI加速上,已經以其獨到的優勢迅速攻城略地。這種千核式的設計其實已經應用于Arm等架構,不少數據中心、超算卻依然在嘗試用RISC-V作為加速器。
RISC-V憑借其開放性、擴展性和自主性,并沒有像Arm那樣由低至高地發展市場,而是低端和高端兩頭抓,一旦消費市場也開始普及RISC-V生態,那時的RISC-V就有與Arm全市場爭霸的希望了。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
AI
+關注
關注
91文章
39793瀏覽量
301438 -
RISC-V
+關注
關注
48文章
2886瀏覽量
53024
發布評論請先 登錄
相關推薦
熱點推薦
OrangePi RV2 深度技術評測:RISC-V AI融合架構的先行者
OrangePi RV2是香橙派推出的一款基于RISC-V架構的AI開發板,搭載KY X1八核處理器。該板以“CPU 融合AI”為核心理念,
發表于 03-03 20:19
新思科技VC Formal解決方案在RISC-V驗證中的應用
——地球上人均 6 顆。從“RISC-V 將無處不在”到“RISC-V,就現在”,RISC-V 已幾乎覆蓋所有應用。當前,RISC-V 已成功躋身世界主流
Banana Pi BPI-CM6 計算模塊將 8 核 RISC-V 處理器帶入 CM4 外形尺寸
更高性能或 AI 功能的用戶來說,BPI-CM6 也非常容易上手。BPI-CM6 擁有 100 kWh 的 RISC-V 六核處理器、200 kWh 的
發表于 12-20 09:01
重磅合作!Quintauris 聯手 SiFive,加速 RISC-V 在嵌入式與 AI 領域落地
據科技區角報道半導體解決方案提供商 Quintauris 最近宣布和 RISC-V 處理器 IP 領域的頭部廠商 SiFive 達成戰略合作,目標直接瞄準加速 RISC-V 在嵌入式、AI
發表于 12-18 12:01
探索RISC-V在機器人領域的潛力
的硬件配置給人留下了深刻的第一印象:
? 核心處理器: 搭載了進迭時空的K1系列高性能RISC-V處理器,具備強大的通用計算能力和AI加速特性。
? 內存與存儲: 板載LPDDR4
發表于 12-03 14:40
突破!深圳諾獎實驗室發布量產級RISC-V處理器IP
11月14日到16日,在第27屆中國國際高新技術成果交易會(簡稱“高交會”)上,來自圖靈獎得主大衛·帕特森教授團隊建立的RISC-V國際開源實驗室(RIOS)正式發布其高性能開源RISC-V處理器IP
基于E203 RISC-V的音頻信號處理系統 -協處理器的乘累加過程
協處理器簡介
RISC-V具有很高的可擴展性,既預留出了指令編碼空間,也提供了預定義的Custom指令;RISC-V的標準指令集僅使用了少部分指令編碼空間,更多的指令編碼空間被預留給用戶進行擴展
發表于 10-28 06:18
國產!全志T113-i 雙核Cortex-A7@1.2GHz 工業開發板—ARM + DSP、RISC-V核間通信開發案例
本文檔主要介紹T113-i處理器的ARM + DSP、RISC-V核間通信開發案例,演示T113-i處理器ARM Cortex-A7與HiFi4 DSP核心、玄鐵C906
明晚開播 |開源芯片系列講座第28期:高性能RISC-V微處理器芯片
鷺島論壇開源芯片系列講座第28期「高性能RISC-V微處理器芯片」明晚(30日)20:00精彩開播期待與您云相聚,共襄學術盛宴!|直播信息報告題目高性能RISC-V微處理器芯片報告簡介
直播預約 |開源芯片系列講座第28期:高性能RISC-V微處理器芯片
鷺島論壇開源芯片系列講座第28期「高性能RISC-V微處理器芯片」7月30日(周三)20:00精彩開播期待與您云相聚,共襄學術盛宴!|直播信息報告題目高性能RISC-V微處理器芯片報告
HPM5E31IGN單核 32 位 RISC-V 處理器
HPM5E31IGN單核 32 位 RISC-V 處理器在當今嵌入式系統領域,RISC-V架構正以開源、靈活和高性價比的優勢快速崛起。HPM5E31IGN作為先楫半導體的一款單核32位RISC
發表于 05-29 09:23
香蕉派 BPI-CM6 工業級核心板采用進迭時空K1 8核 RISC-V 芯片開發
RISC-V 芯片介紹
SpacemiT K1是一款八核64位RISC-V AI CPU。基于RISC-V開放指令集架構,致力于打造更節能
發表于 03-25 14:40
端側AI、數據中心,RISC-V已“上桌”
應用。 ? 最近超睿科技發布了UR-DP1000高性能桌面級RISC-V CPU,這款CPU擁有8個高性能自研RISC-V處理器核UR-CP100,12nm工藝下工作頻率2.0~2.3
千核RISC-V處理器,通往AI之路的完全體
評論