最近的視覺AI模型必須處理動態(tài)和復(fù)雜的環(huán)境,因此在實時應(yīng)用中需要更高的能效和速度。
為了滿足市場需求,瑞薩發(fā)布了下一代動態(tài)可重構(gòu)人工智能處理器(DRP-AI)加速器。DRP-AI加速器提供10 TOPS/W的高功率效率,比傳統(tǒng)技術(shù)高出10倍,它可以在低功耗的傳統(tǒng)嵌入式處理器(MPU)上面運行復(fù)雜的圖像AI模型,而不需要像以前一樣采用高功耗的GPU來運行。
除了這個AI加速器外,高端RZ/V2H MPU還配備了使用動態(tài)可重構(gòu)處理器(DRP)的圖像處理加速器、運行頻率高達(dá)1.8GHz的四核Linux處理器Arm Cortex-A55、雙核800MHz Arm Cortex-R8高速實時處理器和I/O處理Arm Cortex-M33子內(nèi)核,采用異構(gòu)多處理器配置。
動態(tài)可重構(gòu)處理器(DRP)
七個基于Arm的CPU內(nèi)核、下一代DRP-AI和DRP的組合,可以立即處理機械控制中的圖像識別和AI判斷結(jié)果,使其成為下一代自主機器人、自主移動機器人、無人機和其他應(yīng)用的理想AI處理器。
下一代AI加速器DRP-AI
RZ/V2M、RZ/V2L和RZ/V2MA嵌入了瑞薩電子獨創(chuàng)的DRP-AI加速器,但瑞薩已將其獨創(chuàng)的AI加速器DRP-AI升級為下一代,以滿足最近的市場需求。
為了大幅提高電源效率,DRP-AI應(yīng)用了INT8量化和硬件支持,用于非結(jié)構(gòu)化修剪,這是傳統(tǒng)AI加速器難以實現(xiàn)的,以實現(xiàn)高達(dá)80 TOPS的推理性能和10 TOPS/W的電源效率。
下一代高能效AI加速器(DRP-AI3):自治系統(tǒng)高級AI中的嵌入式處理速度提高10倍”白皮書
下圖1顯示了AI推理性能與其他RZ/V產(chǎn)品的比較。以ResNet-50為例,典型的分類卷積神經(jīng)網(wǎng)絡(luò)(CNN)的性能比不修剪的RZ/V2L高14倍(密集模型),采用模型修剪后的RZ/V2H比RZ/V2L(密集模型)性能高45倍。

圖1 RZ/V系列AI推理性能(不包括前/后處理)
通過動態(tài)可重構(gòu)處理器DRP打開CV加速
甚至在深度學(xué)習(xí)出現(xiàn)之前,各種方法就已被用于圖像識別和決策的應(yīng)用中。OpenCV這個開源的計算機視覺庫就是這樣一個例子。即使現(xiàn)在有了AI圖像處理,OpenCV仍然是一項非常有用的技術(shù)。Vision AI和OpenCV現(xiàn)在都在適當(dāng)?shù)膱鼍耙黄鹗褂谩?/p>
為了加速AI和OpenCV等各種圖像處理算法,RZ/V2H MPU設(shè)計了與DRP-AI分離的動態(tài)可重構(gòu)處理器,為OpenCV加速器提供DRP庫,充分利用其靈活性。
圖2比較了具有DRP的OpenCV加速器與RZ/V2H四核CPU的性能。例如,通過使用DRP加速,用于圖像邊緣檢測的Sobel濾波器從7.6fps提高到123fps的速度,提高了16倍。

圖2 OpenCV加速器性能基準(zhǔn)測試
AI異構(gòu)配置+高速實時控制
雖然快速多核Linux處理器是圖像AI的最佳選擇,但它需要大量的內(nèi)存資源,并且很難實現(xiàn)機械控制所需的亞毫秒級實時性能。
為了解決這個問題,RZ/V2H使用四核Cortex-A55來運行包括AI處理在內(nèi)的Linux程序,并使用專用的高速實時處理器在需要高實時性能的應(yīng)用(如電機控制)中進(jìn)行RTOS處理。
通過使用OpenAMP進(jìn)行處理器間不同操作系統(tǒng)的通信連接,DRP-AI和Linux處理器做出的決策結(jié)果可以反映在RTOS處理器的實時機械控制中。

圖3 RZ/V2H框圖
具有這些獨特功能的RZ/V2H嵌入式AI微處理器已投入量產(chǎn),RZ/V2H評估板也可用于快速啟動您的下一個視覺AI開發(fā)。
審核編輯:劉清
-
處理器
+關(guān)注
關(guān)注
68文章
20255瀏覽量
252273 -
機器人
+關(guān)注
關(guān)注
213文章
31079瀏覽量
222244 -
加速器
+關(guān)注
關(guān)注
2文章
839瀏覽量
40103 -
MPU
+關(guān)注
關(guān)注
0文章
455瀏覽量
51340 -
人工智能
+關(guān)注
關(guān)注
1817文章
50098瀏覽量
265365
發(fā)布評論請先 登錄
奇異摩爾參編人工智能加速器互聯(lián)芯粒技術(shù)要求團體標(biāo)準(zhǔn)發(fā)布
瑞芯微SOC智能視覺AI處理器
d-Matrix與Andes晶心科技合作打造下一代AI推理加速器
邊緣計算中的AI加速器類型與應(yīng)用
瑞薩電子RZ/V系列微處理器助力邊緣AI開發(fā)
Flex Power Modules將與瑞薩電子合作推出下一代電源管理解決方案
關(guān)于人工智能處理器的11個誤解
Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)
嵌入式AI加速器DRP-AI 詳細(xì)介紹
用于實時人類和物體識別的視覺-AI ASSP人工智能微處理器RZ/V2M數(shù)據(jù)手冊
3D圖形和視頻編解碼器引擎的通用微處理器RZ/V2L數(shù)據(jù)手冊
Banana Pi 與瑞薩電子攜手共同推動開源創(chuàng)新:BPI-AI2N
瑞薩推出集成DRP-AI加速器的RZ/V2N,擴展中端AI處理器陣容,助力未來智能工廠與智慧城市發(fā)展
瑞薩發(fā)布了下一代動態(tài)可重構(gòu)人工智能處理器(DRP-AI)加速器
評論