Paddle Lite飛槳多平臺(tái)高性能深度學(xué)習(xí)預(yù)測(cè)引擎
資料介紹
軟件簡(jiǎn)介
Paddle Lite為Paddle-Mobile的升級(jí)版,定位支持包括手機(jī)移動(dòng)端在內(nèi)更多場(chǎng)景的輕量化高效預(yù)測(cè),支持更廣泛的硬件和平臺(tái),是一個(gè)高性能、輕量級(jí)的深度學(xué)習(xí)預(yù)測(cè)引擎。在保持和PaddlePaddle無(wú)縫對(duì)接外,也兼容支持其他訓(xùn)練框架產(chǎn)出的模型。
## CPU版本安裝命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle
## GPU版本安裝命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu
特性
輕量級(jí)
執(zhí)行階段和計(jì)算優(yōu)化階段實(shí)現(xiàn)良好解耦拆分,移動(dòng)端可以直接部署執(zhí)行階段,無(wú)任何第三方依賴。 包含完整的80個(gè) Op+85個(gè) Kernel 的動(dòng)態(tài)庫(kù),對(duì)于ARMV7只有800K,ARMV8下為1.3M,并可以裁剪到更低。 在應(yīng)用部署時(shí),載入模型即可直接預(yù)測(cè),無(wú)需額外分析優(yōu)化。
高性能
極致的 ARM CPU 性能優(yōu)化,針對(duì)不同微架構(gòu)特點(diǎn)實(shí)現(xiàn)kernel的定制,最大發(fā)揮計(jì)算性能,在主流模型上展現(xiàn)出領(lǐng)先的速度優(yōu)勢(shì)。 支持INT8量化計(jì)算,結(jié)合?PaddleSlim 模型壓縮工具?中 INT8量化訓(xùn)練功能,可以提供高精度高性能的預(yù)測(cè)能力。 在Huawei NPU, FPGA上也具有有很好的性能表現(xiàn)。
最新 Benchmark 位于?benchmark。
通用性
硬件方面,Paddle Lite 的架構(gòu)設(shè)計(jì)為多硬件兼容支持做了良好設(shè)計(jì)。除了支持ARM CPU、Mali GPU、Adreno GPU,還特別支持了華為 NPU,以及 FPGA 等邊緣設(shè)備廣泛使用的硬件。即將支持支持包括寒武紀(jì)、比特大陸等AI芯片,未來(lái)會(huì)增加對(duì)更多硬件的支持。
模型支持方面,Paddle Lite和PaddlePaddle訓(xùn)練框架的Op對(duì)齊,提供更廣泛的模型支持能力。目前已嚴(yán)格驗(yàn)證18個(gè)模型85個(gè)OP的精度和性能,對(duì)視覺(jué)類模型做到了較為充分的支持,覆蓋分類、檢測(cè)和定位,包含了特色的OCR模型的支持。未來(lái)會(huì)持續(xù)增加更多模型的支持驗(yàn)證。
框架兼容方面:除了PaddlePaddle外,對(duì)其他訓(xùn)練框架也提供兼容支持。當(dāng)前,支持Caffe 和 TensorFlow 訓(xùn)練出來(lái)的模型,通過(guò)X2Paddle?轉(zhuǎn)換工具實(shí)現(xiàn)。接下來(lái)將會(huì)對(duì)ONNX等格式模型提供兼容支持。
架構(gòu)
PaddleLite 的架構(gòu)設(shè)計(jì)著重考慮了對(duì)多硬件和平臺(tái)的支持,并且強(qiáng)化了多個(gè)硬件在一個(gè)模型中混合執(zhí)行的能力,多個(gè)層面的性能優(yōu)化處理,以及對(duì)端側(cè)應(yīng)用的輕量化設(shè)計(jì)。
其中,Analysis Phase 包括了 MIR(Machine IR) 相關(guān)模塊,能夠?qū)υ械哪P偷挠?jì)算圖針對(duì)具體的硬件列表進(jìn)行算子融合、計(jì)算裁剪 在內(nèi)的多種優(yōu)化。Execution Phase 只涉及到Kernel 的執(zhí)行,且可以單獨(dú)部署,以支持極致的輕量級(jí)部署。
Paddle-Mobile升級(jí)為Paddle Lite的說(shuō)明
原Paddle-Mobile作為一個(gè)致力于嵌入式平臺(tái)的PaddlePaddle預(yù)測(cè)引擎,已支持多種硬件平臺(tái),包括ARM CPU、 Mali GPU、Adreno GPU,以及支持蘋果設(shè)備的GPU Metal實(shí)現(xiàn)、ZU5、ZU9等FPGA開(kāi)發(fā)板、樹(shù)莓派等arm-linux開(kāi)發(fā)板。在百度內(nèi)已經(jīng)過(guò)廣泛業(yè)務(wù)場(chǎng)景應(yīng)用驗(yàn)證。對(duì)應(yīng)設(shè)計(jì)文檔可參考:?mobile/README
Paddle-Mobile 整體升級(jí)重構(gòu)并更名為Paddle Lite后,原paddle-mobile 的底層能力大部分已集成到新架構(gòu)?下。作為過(guò)渡,暫時(shí)保留原Paddle-mobile代碼。 主體代碼位于?mobile/?目錄中,后續(xù)一段時(shí)間會(huì)繼續(xù)維護(hù),并完成全部遷移。新功能會(huì)統(tǒng)一到新架構(gòu)?下開(kāi)發(fā)。
metal, web的模塊相對(duì)獨(dú)立,會(huì)繼續(xù)在?./metal?和?./web?目錄下開(kāi)發(fā)和維護(hù)。對(duì)蘋果設(shè)備的GPU Metal實(shí)現(xiàn)的需求及web前端預(yù)測(cè)需求,可以直接進(jìn)入這兩個(gè)目錄。
- 華為智慧終端背后的黑科技--超輕量AI引擎MindSpore Lite,性能評(píng)測(cè)結(jié)果領(lǐng)先
- 一種新型的多智能體深度強(qiáng)化學(xué)習(xí)算法 36次下載
- 基于深度學(xué)習(xí)的光學(xué)成像算法綜述 10次下載
- 基于深度學(xué)習(xí)的信息級(jí)聯(lián)預(yù)測(cè)方法研究綜述 9次下載
- 基于特征學(xué)習(xí)的鏈路預(yù)測(cè)TNTlink模型綜述 12次下載
- 基于預(yù)訓(xùn)練模型和長(zhǎng)短期記憶網(wǎng)絡(luò)的深度學(xué)習(xí)模型 19次下載
- 3小時(shí)學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)課件下載 0次下載
- 深度模型中的優(yōu)化與學(xué)習(xí)課件下載 3次下載
- 一種多通道自編碼器深度學(xué)習(xí)的入侵檢測(cè)方法 7次下載
- 一種屏幕內(nèi)容編碼幀內(nèi)CTU深度范圍預(yù)測(cè)快速算法 22次下載
- MXNet深度學(xué)習(xí)計(jì)算平臺(tái)中文學(xué)習(xí)筆記免費(fèi)下載 3次下載
- 如何使用情感分析和深度學(xué)習(xí)實(shí)現(xiàn)宏觀經(jīng)濟(jì)預(yù)測(cè)方法 15次下載
- 深度學(xué)習(xí)是什么?了解深度學(xué)習(xí)難嗎?讓你快速了解深度學(xué)習(xí)的視頻講解 16次下載
- 深度學(xué)習(xí)的機(jī)會(huì)網(wǎng)絡(luò)鏈路預(yù)測(cè) 0次下載
- 基于集成多標(biāo)記學(xué)習(xí)的蛋白質(zhì)多亞細(xì)胞定位預(yù)測(cè)方法 0次下載
- 深度剖析CC1352R:高性能多頻段無(wú)線MCU的卓越之選 114次閱讀
- 澎峰科技高性能大模型推理引擎PerfXLM解析 2.2k次閱讀
- 深度學(xué)習(xí)中的時(shí)間序列分類方法 2.9k次閱讀
- 為OpenVINO添加對(duì)Paddle 2.5的支持 1.2k次閱讀
- 如何基于深度學(xué)習(xí)模型訓(xùn)練實(shí)現(xiàn)工件切割點(diǎn)位置預(yù)測(cè) 1.5k次閱讀
- 如何基于深度學(xué)習(xí)模型訓(xùn)練實(shí)現(xiàn)圓檢測(cè)與圓心位置預(yù)測(cè) 3.8k次閱讀
- 深度學(xué)習(xí)中的圖像分割 2k次閱讀
- 基于深度學(xué)習(xí)的兩相流氣泡末速度預(yù)測(cè) 1.6k次閱讀
- 基于NGC飛槳容器PP-ShituV2 輕量級(jí)圖像識(shí)別系統(tǒng) 2.7k次閱讀
- 做時(shí)間序列預(yù)測(cè)是否有必要用深度學(xué)習(xí) 2.4k次閱讀
- 淺論學(xué)習(xí)深度學(xué)習(xí)的四個(gè)步驟 1.3w次閱讀
- 深度探究機(jī)器學(xué)習(xí)與圖像融合的技術(shù)基于TOF硬件平臺(tái)的技術(shù)應(yīng)用 5.4k次閱讀
- 對(duì)比深度學(xué)習(xí)和經(jīng)典機(jī)器學(xué)習(xí),分別介紹這兩種技術(shù)的優(yōu)缺點(diǎn) 2.7w次閱讀
- 如何區(qū)分深度學(xué)習(xí)與機(jī)器學(xué)習(xí) 2.1k次閱讀
- 深度學(xué)習(xí)開(kāi)源框架,AI從業(yè)者的選擇之路 2.6k次閱讀
下載排行
本周
- 1新一代網(wǎng)絡(luò)可視化(NPB 2.0)
- 3.40 MB | 1次下載 | 免費(fèi)
- 2冷柜-電氣控制系統(tǒng)講解
- 13.68 MB | 1次下載 | 10 積分
- 3MDD品牌三極管MMBT3906數(shù)據(jù)手冊(cè)
- 2.33 MB | 次下載 | 免費(fèi)
- 4MDD品牌三極管S9012數(shù)據(jù)手冊(cè)
- 2.62 MB | 次下載 | 免費(fèi)
- 5LAT1218 如何選擇和設(shè)置外部晶體適配 BlueNRG-X
- 0.60 MB | 次下載 | 3 積分
- 6LAT1216 Blue NRG-1/2 系列芯片 Flash 操作與 BLE 事件的互斥處理
- 0.89 MB | 次下載 | 3 積分
- 7收音環(huán)繞擴(kuò)音機(jī) AVR-1507手冊(cè)
- 2.50 MB | 次下載 | 免費(fèi)
- 8MS1000TA 超聲波測(cè)量模擬前端芯片技術(shù)手冊(cè)
- 0.60 MB | 次下載 | 免費(fèi)
本月
- 1愛(ài)華AIWA HS-J202維修手冊(cè)
- 3.34 MB | 37次下載 | 免費(fèi)
- 2PC5502負(fù)載均流控制電路數(shù)據(jù)手冊(cè)
- 1.63 MB | 23次下載 | 免費(fèi)
- 3NB-IoT芯片廠商的資料說(shuō)明
- 0.31 MB | 22次下載 | 1 積分
- 4UWB653Pro USB口測(cè)距通信定位模塊規(guī)格書(shū)
- 838.47 KB | 5次下載 | 免費(fèi)
- 5蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
- 0.04 MB | 4次下載 | 1 積分
- 6蘇泊爾DCL6909(即CHK-S009)單芯片電磁爐原理圖資料
- 0.08 MB | 2次下載 | 1 積分
- 7100W準(zhǔn)諧振反激式恒流電源電路圖資料
- 0.09 MB | 2次下載 | 1 積分
- 8FS8025B USB的PD和OC快充協(xié)議電壓誘騙控制器IC技術(shù)手冊(cè)
- 1.81 MB | 1次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935137次下載 | 10 積分
- 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191439次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183353次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81602次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73822次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App





創(chuàng)作
發(fā)文章
發(fā)帖
提問(wèn)
發(fā)資料
發(fā)視頻
上傳資料賺積分
評(píng)論