飛槳技術(shù)生態(tài)伙伴 算力魔方
| 引言:還在為OCR模型在不同硬件上的部署而頭疼嗎?百度飛槳的PP-OCRv5重磅升級(jí),準(zhǔn)確率提升13%,且一個(gè)模型同時(shí)支持中、英、日等五種文字!本文將手把手教你如何將PP-OCRv5模型轉(zhuǎn)換為通用ONNX格式,讓你能在Intel、AMD、高通、蘋果等各類設(shè)備上輕松部署,真正實(shí)現(xiàn)“一次轉(zhuǎn)換,隨處運(yùn)行”。

在當(dāng)前多語(yǔ)言混合文檔處理需求日益增長(zhǎng)的背景下,百度飛槳推出的PP-OCRv5
https://github.com/PaddlePaddle/PaddleOCR
成為了業(yè)界矚目的焦點(diǎn)。這款輕量級(jí)光學(xué)字符識(shí)別(OCR)系統(tǒng)不僅將準(zhǔn)確率提升了13%,更強(qiáng)大的是,它實(shí)現(xiàn)了單一模型同時(shí)識(shí)別簡(jiǎn)體中文、繁體中文、英文、日文和拼音五大文本類型,堪稱文檔處理領(lǐng)域的“瑞士軍刀”。
一,為何需要轉(zhuǎn)換為ONNX格式?
盡管PP-OCRv5本身非常強(qiáng)大,但若想將其部署在Intel、AMD、高通、蘋果、瑞芯微等各式各樣的AI推理設(shè)備上,直接使用原模型可能會(huì)面臨兼容性挑戰(zhàn)。而ONNX(Open Neural Network Exchange) 作為一個(gè)開放的模型格式標(biāo)準(zhǔn),就像是AI世界的“通用翻譯官”,能夠幫助你的模型在不同的硬件和框架之間自由穿梭。
只需完成一次轉(zhuǎn)換,即可利用ONNX Runtime, TensorRT, OpenVINO, ROCm等眾多推理引擎進(jìn)行高速推理,極大地?cái)U(kuò)展了應(yīng)用邊界。
二,四步上手:PP-OCRv5模型轉(zhuǎn)換ONNX全流程
1,準(zhǔn)備工作:安裝所需環(huán)境與工具
首先,我們需要一個(gè)干凈的Python環(huán)境來(lái)避免庫(kù)版本沖突。推薦使用Anaconda創(chuàng)建虛擬環(huán)境。
# 創(chuàng)建并激活名為 ppocrv5_ov 的虛擬環(huán)境
conda create -n ppocrv5_ov python=3.11
conda activate ppocrv5_ov

接下來(lái),安裝必不可少的PaddlePaddle深度學(xué)習(xí)框架和PaddleOCR庫(kù)。
# 安裝PaddlePaddle和PaddleOCR
pip install paddlepaddle
pip install paddleocr
# 安裝高性能推理依賴(CPU版)
paddleocr install_hpi_deps cpu
最后,安裝本次轉(zhuǎn)換的“主角”——模型轉(zhuǎn)換工具 paddle2onnx 。
# 安裝paddle2onnx轉(zhuǎn)換工具
paddlex --install paddle2onnx

2,下載預(yù)訓(xùn)練模型
我們將官方提供的服務(wù)器版高性能模型下載到本地。它們分別是檢測(cè)(detection)、識(shí)別(recognition)和分類(classification) 模型。
# 1. 下載并解壓文本檢測(cè)模型
wget https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/PP-OCRv5_server_det_infer.tar
tar -xvf PP-OCRv5_server_det_infer.tar
# 2. 下載并解壓文本識(shí)別模型
wget https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/PP-OCRv5_server_rec_infer.tar
tar -xvf PP-OCRv5_server_rec_infer.tar
# 3. 下載并解壓文本方向分類模型
wget https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/PP-LCNet_x1_0_doc_ori_infer.tar
tar -xvf PP-LCNet_x1_0_doc_ori_infer.tar

3,核心步驟:模型轉(zhuǎn)換
現(xiàn)在,我們使用安裝好的 paddle2onnx 工具,將三個(gè)模型依次轉(zhuǎn)換為ONNX格式。
# 轉(zhuǎn)換檢測(cè)模型
paddlex --paddle2onnx --paddle_model_dir ./PP-OCRv5_server_det_infer --onnx_model_dir ./PP-OCRv5_server_det_onnx
# 轉(zhuǎn)換識(shí)別模型
paddlex --paddle2onnx --paddle_model_dir ./PP-OCRv5_server_rec_infer --onnx_model_dir ./PP-OCRv5_server_rec_onnx
# 轉(zhuǎn)換分類模型
paddlex --paddle2onnx --paddle_model_dir ./PP-LCNet_x1_0_doc_ori_infer --onnx_model_dir ./PP-OCRv5_server_cls_onnx
轉(zhuǎn)換成功后,你將在當(dāng)前目錄看到三個(gè)對(duì)應(yīng)的新文件夾(PP-OCRv5_server_det_onnx, PP-OCRv5_server_rec_onnx, PP-OCRv5_server_cls_onnx),里面便是生成的ONNX模型文件。
4,驗(yàn)證轉(zhuǎn)換結(jié)果
理論轉(zhuǎn)完了,實(shí)際能用嗎?讓我們寫個(gè)腳本測(cè)試一下。
首先,下載一張示例圖片:
wget https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png
然后,使用PaddleOCR命令,指定我們剛剛轉(zhuǎn)換好的ONNX模型進(jìn)行推理:
paddleocr ocr -i ./general_ocr_002.png
--text_detection_model_name PP-OCRv5_server_det
--text_detection_model_dir PP-OCRv5_server_det_onnx
--text_recognition_model_name PP-OCRv5_server_rec
--text_recognition_model_dir PP-OCRv5_server_rec_onnx/
--enable_hpi True
--device cpu
如果終端成功打印出了圖片中的文字識(shí)別結(jié)果,那么恭喜你!這意味著從模型轉(zhuǎn)換到推理的整個(gè)流程已全部跑通,ONNX模型工作正常。

三,結(jié)語(yǔ)與展望
通過(guò)以上五個(gè)步驟,我們成功地將PP-OCRv5模型轉(zhuǎn)換為了ONNX格式,為其在廣闊硬件平臺(tái)上的部署打開了大門。無(wú)論是云端服務(wù)器還是邊緣設(shè)備,ONNX都能提供強(qiáng)大的跨平臺(tái)能力。
審核編輯 黃宇
-
OCR
+關(guān)注
關(guān)注
0文章
175瀏覽量
17199 -
飛槳
+關(guān)注
關(guān)注
0文章
37瀏覽量
2641
發(fā)布評(píng)論請(qǐng)先 登錄
深入解析TPS25961 eFuse:功能特性與應(yīng)用設(shè)計(jì)全攻略
UPS不間斷電源是什么?企業(yè)如何選型與維護(hù)?2026年全攻略
迅為驅(qū)動(dòng)開發(fā)實(shí)戰(zhàn):iTOP-RK3568開發(fā)板e(cuò)DP屏幕移植全攻略
一鍵配網(wǎng)失敗怎么辦?機(jī)智云熱點(diǎn)配網(wǎng)全攻略
醫(yī)療電子EMC整改:原理到實(shí)戰(zhàn)的系統(tǒng)化全攻略策略
用ROCm部署PP-StructureV3到AMD GPU上
基于DP1323EL的電動(dòng)車解鎖方案:超高速讀寫,提升電動(dòng)車一鍵解鎖體驗(yàn)
使用OpenVINO將PP-OCRv5模型部署在Intel顯卡上
【EASY EAI Orin Nano開發(fā)板試用體驗(yàn)】PP-OCRV5文字識(shí)別實(shí)例搭建與移植
基于算力魔方與PP-OCRv5的OpenVINO智能文檔識(shí)別方案
UC3854 功率因數(shù)校正設(shè)計(jì)全攻略:從理論到實(shí)戰(zhàn)
使用OpenVINO優(yōu)化并部署飛槳PP-OCRv4模型
一鍵搞定!PP-OCRv5模型轉(zhuǎn)ONNX格式全攻略,解鎖多平臺(tái)無(wú)縫部署
評(píng)論