瑞薩電子宣布推出針對人工智能(AI)、機器學習(ML)應用以及實時分析的RA8P1微控制器(MCU)產品群。該系列MCU通過將1GHz Arm Cortex-M85和250MHz Cortex-M33 CPU核心與Arm EthosTM-U55神經處理單元(NPU)相結合,從而樹立MCU性能的新標桿。作為瑞薩電子深度合作伙伴,RT-Thread已率先完成對該芯片的適配支持。本文將詳解如何快速移植RT-Thread,帶大家一起體驗M85!

目錄
芯片介紹
RT-Thread 移植
測試結果
總結
1
芯片介紹

從數據手冊上看出 RA8P1 是一顆雙核異構的芯片,由大核Cortex-M85+小核Cortex-M33組成。在此基礎上額外集成了 NPU 運算單元,專門用于加速機器學習推論所設計。
主頻上,M85主核心竟然達到了1GHZ,這個速度是以往系列都沒有的主頻,一個字“快”,
M33 從核心主頻是 250MHZ,同時 RA8P1 有64KB的數據+指令Cache,其中我手上這顆R7KA8P1KFLCAC芯片: CPU0 和 CPU1對應的 I/D Caches 和 C/S Caches 容量各 32KB。
外設接口上,RA8P1最多的支持10路SCI外設接口(可以靈活配置成UART,SPI,I2C),OSPI x 2可以拓展外擴最高8線 的 Hyperam,flash 等存儲器件。
人機交互接口上,和RA8D1一樣支持 MIPI-DSI,GLCDC 可以二選一搭配 MIPI/RGB 接口的屏幕使用。
除CEU(數字攝像頭接口)外,視頻輸入接口新增MIPI-CSI外設,顯著提升攝像頭數據帶寬,確保AI處理場景下前置輸入帶寬的穩定性。

在網絡接口上,RA8P1支持L3以太網交換機模塊(ESWM),允許連接到網絡的各種設備進行數據交換和相互通信。其支持多協議接口,它能夠在同一網絡或不同網絡接口協議之間自主路由幀數據,適用于網關應用。

2
RT-Thread 移植
讓我們快速移植 RT-Thread體驗下:
參考RT-Thread文檔中心針對RA系列的BSP制作教程+Vision Board SDK倉庫,由于RA8P1的啟動方式是大核先啟動,那么我們可以先以單核方式快速移植RTT,這里不多加贅述。
下載E2Studio即可快速體驗裸機開發;
將 RT-Thread 源碼加入工程,加入設備驅動框架對接層;
運行 RT-Thread 的基本條件是Systick時鐘和串口驅動,對于RT-Thread中已經實現的非常完善;
外設上在FSP中只需要配置一個通訊的串口即可

正式開始移植
在移植過程中可以用過E2Studio進行針對多核進行調試仿真,體驗下來也是比較流暢的:

如果想要啟動從核(M33)可以直接調用FSP封裝好的庫函數:

至此RT-Thread已經正常的運行起來了:

在BSP根目錄下啟動env工具:RT-Thread具有完善的軟件生態,我們可以快速的針對芯片進行性能測試,那么有請第一個軟件包登場:CoreMark

使用env 配置工具在軟件包倉庫中使能COREMARK軟件包,通過pkgs --update拉取到本地項目中參與構建:

設置 corkmark 運算迭代次數為:80000(按需設置,對于性能較強的芯片需要增加次數)

在hal_entry.c中,執行 coremark 程序進行跑分測試:

初步使用O0等級優化測試結果:

什么M85內核才區區500分?這和理想中的分數天差地別了,接下來開始進行優化:
1 開啟Dcache和Icache:

qemu-system-riscv32 -machine smartl -nographic -kernel rtthread.elf -cpu e906fd -gdb tcp::23333-S
2 修改測試區域內存為DTCM段:

3
測試結果
CPU0:Cortex-M85 儲存介質:MRAM(磁阻式隨機存取內存)
編譯器版本 : GCC13.2.1
編譯參數:-mfloat-abi=hard -mfpu=fpv5-sp-d16Ofast
Coremark分數:4896.132056

CPU1:Cortex-M33
儲存介質:MRAM(磁阻式隨機存取內存)
編譯器版本 : GCC13.2.1
編譯參數:-mfloat-abi=hard -mfpu=fpv5-sp-d16Ofast
Coremark分數:570.356473

以上的測試結果是使用GCC工具鏈進行編譯,更換成 ARMCLANG/LLVM 工具鏈跑分可能還會提升一些。
4
總結
RA8P1芯片搭載雙核異構M85和M33內核,相較前代RA8系列在主頻、帶寬及外設接口方面實現顯著性能提升,并集成Ethos-U55 NPU的32位AI加速微控制器(MCU)。
該芯片在語音、視覺及實時分析AI場景中表現出色,性能強勁。后續計劃移植RP-Msglite組件,結合RT-Thread在RA8P1上實現雙核間高效數據通信,充分釋放雙核性能潛力。
-
微控制器
+關注
關注
48文章
8375瀏覽量
164539 -
芯片
+關注
關注
463文章
54007瀏覽量
465896 -
內核
+關注
關注
4文章
1467瀏覽量
42869 -
瑞薩電子
+關注
關注
39文章
2973瀏覽量
74359
發布評論請先 登錄
分享四款使用瑞薩RA8M1 MCU或RA8D1 MCU的成功產品組合解決方案
瑞薩電子RA8P1系列32位AI MCU介紹
瑞薩Cortext-M85內核RA8系列單片機的串口輸出實現方法
1 GHz Arm? Cortex?-M85 MCU上部署AI模型
瑞薩面向電機控制應用推出性能卓越的RA8 MCU
RT-Thread支持瑞薩全新超高性能Arm? Cortex?-M85 MCU
瑞薩電子宣布推出RA8D1微控制器(MCU)產品群
Cortex-M85內核單片機如何快速上手
AI MCU# 瑞薩RA8T1搭載 Helium 和 TrustZone 的電機控制MCU 詳細介紹
貿澤開售Renesas Electronics RA8P1微控制器 為先進AI提供高CPU性能
RT-Thread首款AI硬件搶先曝光!——RA8P1 Titan Board
正式上市: Cortex-M85 RA8P1 Titan Board重新定義,邊緣AI的性能邊界 | 產品動態
【直播預告】RT-Thread帶你首發體驗:基于瑞薩RA8P1 MCU的Titan Board | 問學直播
RA8P1部署ai模型指南:從訓練模型到部署?|?本周六
地表最強M85內核芯片-RA8P1測評 | 技術集結
評論