在邊緣計算領(lǐng)域,算力與實時性之間的博弈從未停止。近期基于米爾MYD-LR3576 開發(fā)板+PCIe M.2接口Hailo-8算力卡進(jìn)行了一系列深度測試,一組實測數(shù)據(jù),或許能幫你重新審視邊緣AI的“性能天花板”。

圖:米爾基于RK3576開發(fā)板
一、RK3576 的算力極限在哪里?
RK3576內(nèi)置NPU由2核組成,具備6 TOPS 算力,在常規(guī)輕量級模型推理中表現(xiàn)不俗。但在實際項目中,我們通過多路并發(fā)測試發(fā)現(xiàn),當(dāng)4路YOLOv5模型同時推理時,NPU負(fù)載率已超過75%。一旦增加到第5路,整體延遲急劇飆升,系統(tǒng)響應(yīng)明顯劣化。
在單路推理場景下,YOLOv5(640×640)耗時約26ms,折算下來僅能穩(wěn)定處理30fps的攝像頭數(shù)據(jù)。
這意味著什么?
當(dāng)攝像頭升級到60fps甚至120fps的高幀率場景時,單靠RK3576的NPU已經(jīng)無法做到逐幀實時處理。要么丟幀,要么延遲不斷累積——這在工業(yè)高速檢測、智慧交通、機(jī)器人導(dǎo)航等對實時性要求嚴(yán)苛的應(yīng)用中,是不可接受的。
二、Hailo-8算力卡介紹
Hailo-8 是一款專為邊緣 AI 推理設(shè)計的專用加速器,擁有26TOPS算力,面向嵌入式設(shè)備和低功耗場景,提供高效、可擴(kuò)展的 AI 計算能力。官方網(wǎng)址:https://hailo.ai/。為什么 Hailo-8 能在相同功耗下實現(xiàn)數(shù)倍于傳統(tǒng) NPU 的性能?答案不在算力數(shù)字,而在架構(gòu):
1. 數(shù)據(jù)流架構(gòu)(Dataflow Architecture)
傳統(tǒng)NPU像“工廠”從倉庫(DDR)來回搬運數(shù)據(jù),效率受限于搬運速度。而Hailo-8的數(shù)據(jù)流架構(gòu)讓數(shù)據(jù)在芯片內(nèi)部“流水線式”流動,大幅減少對外部內(nèi)存的依賴。簡單說:算力不再是瓶頸,內(nèi)存帶寬才是——而Hailo-8繞開了這個瓶頸。
2. 無外部 DRAM 依賴
Hailo-8不依賴外部大帶寬內(nèi)存,推理過程中幾乎不與CPU/NPU爭搶DDR資源。在多路視頻并發(fā)場景下,這意味著系統(tǒng)不會因為“搶內(nèi)存”而掉幀,整體穩(wěn)定性大幅提升。
三、實測數(shù)據(jù):讓性能說話
在相同模型條件下(YOLOv5s):
加速模塊/算力卡 | 單幀耗時 | 等效FPS |
RK3576 NPU | 26ms | ~38 FPS |
Hailo-8 | 8.241ms | ~121 FPS |
在更復(fù)雜模型(YOLOv8s)測試中,Hailo-8算力卡benchmark測試如下:
root@rk3576:~# hailortcli benchmark ./yolov8s.hef
Starting Measurements...
=======Summary=======FPS(hw_only)=208.543(streaming) = 208.1Latency (hw) = 7.03997 msDevice 000000.0: Power in streaming mode (average) = 3.07729 W(max) = 3.13305 W
7毫秒的推理延遲意味著:即使是120fps的高速攝像頭,系統(tǒng)也能輕松應(yīng)對,做到逐幀實時處理。
我們還運行了Hailo-8自帶的攝像頭實時推理示例,效果如下:
四、應(yīng)用場景:當(dāng)實時性成為剛需
這套方案能解決哪些實際問題?我們來看幾個典型場景:
工業(yè)高速視覺檢測:120fps工業(yè)相機(jī)捕捉高速產(chǎn)線上的工件,Hailo-8的8ms推理延遲確保缺陷被實時發(fā)現(xiàn)并剔除,避免漏檢流入下一道工序。
智慧交通卡口:車輛高速通過時,系統(tǒng)需毫秒級完成檢測+識別+跟蹤。208 FPS的吞吐能力讓單節(jié)點可同時處理多模型,不丟車、不漏牌。
安防邊緣節(jié)點:4路以上4K視頻同時分析,Hailo-8的高吞吐讓單節(jié)點覆蓋范圍翻倍,大幅降低每路視頻的硬件成本。
五、總結(jié):彈性算力,從容應(yīng)對高幀率挑戰(zhàn)
通過以上測試,我們可以清晰地看到:
引入Hailo-8算力卡后,YOLOv5推理時間縮短至8ms,YOLOv8實測達(dá)到208 FPS的吞吐量,不僅輕松覆蓋120fps攝像頭的全幀率推理,更預(yù)留了充足的算力余量。
彈性算力,按需選擇:成本敏感項目可單獨使用RK3576;高幀率、低延遲場景只需增加Hailo-8模塊,無需更換主控。
突破架構(gòu)局限,實現(xiàn)真正實時:Hailo-8的數(shù)據(jù)流架構(gòu)將有效算力利用率提升至80%以上,配合RK3576的PCIe 2.1接口,讓推理延遲從毫秒級壓縮至微秒級。
為未來預(yù)留空間:算法快速迭代的今天,RK3576+Hailo-8的組合為未來兩年的算法升級提供了充足的算力冗余,保護(hù)客戶的硬件投資。
延伸閱讀:如果你想深入了解RK3576的NPU的極致利用技巧,歡迎查閱我們此前的文章:《看過來,RK3576NPU方案你用對了嗎?》
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
攝像頭
+關(guān)注
關(guān)注
61文章
5103瀏覽量
103348 -
開發(fā)板
+關(guān)注
關(guān)注
26文章
6355瀏覽量
119535 -
邊緣計算
+關(guān)注
關(guān)注
22文章
3545瀏覽量
53610 -
米爾電子
+關(guān)注
關(guān)注
2文章
193瀏覽量
1101
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
米爾瑞芯微RK3576實測輕松搞定三屏八攝像頭
RK3576參數(shù)強勁RK3576是瑞芯微推出的一款高性能AIoT處理器,這款芯片以其卓越的計算能力、多屏幕支持、強大的視頻編解碼能力和高效的協(xié)處理器而聞名。
三屏8攝像頭輕松搞定
發(fā)表于 01-17 11:33
RK3576助力智慧安防:8路高清采集與AI識別
RK3576核心板的技術(shù)平臺如何匹配安防需求? 多路高清采集與拼接:支持8路1080P AHD攝像頭同步采集,通過米爾AHD視頻轉(zhuǎn)換模塊轉(zhuǎn)換為MIPI信號輸入RK3576核心板平臺,借
發(fā)表于 08-22 17:41
360環(huán)視硬件平臺為什么推薦使用米爾RK3576開發(fā)板?
利于跨工位協(xié)同與對比分析。· 智慧社區(qū) AI 防控:基于6TOPS NPU可擴(kuò)展高空拋物、陌生人闖入、電動車進(jìn)電梯等識別場景,實現(xiàn)前端邊緣智能與快速響應(yīng)。 RK3576獲取12路 攝像頭數(shù)據(jù)編碼傳輸
發(fā)表于 09-19 17:38
車載360環(huán)視平臺:米爾RK3576開發(fā)板支持12路低延遲推流
)擴(kuò)展:借助 6TOPS NPU,環(huán)視系統(tǒng)還能疊加行人檢測、車輛識別、危險預(yù)警等功能,進(jìn)一步拓展為智能駕駛的重要模塊。
四、總結(jié)與引導(dǎo)米爾RK3576開發(fā)板憑借 多路攝像頭 接入能力、高效視頻編解碼
發(fā)表于 10-11 17:55
RK3576機(jī)器人核心:三屏異顯+八路攝像頭,重塑機(jī)器人交互與感知
瑞芯微RK3576 AIoT處理器處理器憑借其卓越的多屏異顯與8路攝像頭接入能力,為機(jī)器人領(lǐng)域帶來革新。米爾電子MYD-LR3576開發(fā)板實測數(shù)據(jù)顯示,在
發(fā)表于 10-29 16:41
RK3576驅(qū)動高端顯控系統(tǒng)升級:多屏拼控與AI視覺融合解決方案
下達(dá)任務(wù)指令,副屏監(jiān)測 AI 分析結(jié)果,大屏實時展示各區(qū)域畫面與運行狀態(tài),真正實現(xiàn) “一屏決策,多屏聯(lián)動”。
八路攝像頭輸入:實現(xiàn)多源視頻融合與 AI 識別RK3576 原生支持
發(fā)表于 11-21 17:51
基于米爾RK3576的環(huán)視實時性方案解析
張正友標(biāo)定法預(yù)先獲取攝像頭內(nèi)參和畸變系數(shù),實時消除魚眼鏡頭產(chǎn)生的圖像扭曲。投影變換: 通過預(yù)設(shè)的單應(yīng)性矩陣(Homography Matrix),將矯正后的透視圖像轉(zhuǎn)換為統(tǒng)一的俯瞰視角鳥瞰圖。圖像拼接
發(fā)表于 11-28 16:57
YOLO5目標(biāo)檢測方案-基于米爾RK3576開發(fā)板
本文基于米爾MYD-LR3576開發(fā)板,詳細(xì)記錄了如何利用500萬像素USB攝像頭實現(xiàn)640×640分辨率的YOLO5s目標(biāo)檢測,并將結(jié)果實時輸出至1080P屏幕的全流程。通過系統(tǒng)級的軟硬件協(xié)同優(yōu)化
發(fā)表于 01-22 19:21
倒車攝像頭,讓倒車不再是噩夢
隨著汽車駕駛性能的不斷提高,攝像頭在汽車中的作用愈加明顯。攝像頭的加入讓駕駛?cè)藛T更加自如的操作自己的愛車,減少了由于汽車物理架構(gòu)存在的盲區(qū)。不過攝像頭也是駕駛違章的克星,因為交警正是利
發(fā)表于 03-12 09:19
?3060次閱讀
RK3576有多強?實測三屏八攝像頭輕松搞定
RK3576參數(shù)強勁RK3576是瑞芯微推出的一款高性能AIoT處理器,這款芯片以其卓越的計算能力、多屏幕支持、強大的視頻編解碼能力和高效的協(xié)處理器而聞名。三屏8攝像頭輕松搞定米爾基于
RK3576基于UVC協(xié)議USB攝像頭配置指南,手把手教你搞定
瑞芯微RK3576芯片平臺基于UVC協(xié)議,配置USB攝像頭實現(xiàn)即插即用的適配采集功能,基于觸覺智能RK3576開發(fā)板PurplePiOH2演示。UVC協(xié)議UVC協(xié)議簡介UVC
當(dāng)6 TOPS不再是極限:RK3576+Hailo-8,讓高幀率攝像頭真正“實時”
評論