国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用ROCm將PP-OCRv5模型部署在AMD顯卡上

jf_23871869 ? 來源:AVNET 李鑫杰 ? 作者:AVNET 李鑫杰 ? 2025-09-12 18:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:AVNET 李鑫杰

上文介紹了《一鍵搞定!PP-OCRv5模型轉ONNX格式全攻略》,本文將使用ROCm?在AMD? CPU、獨立顯卡、集成顯卡上優化并部署飛槳PP-OCRv5模型。

一,ROCm? 工具套件簡介

ROCm?(Radeon Open Compute)是 AMD 推出的開源軟件棧,旨在為 GPU 加速計算提供全面支持。它包含驅動程序、編譯器、開發工具、庫函數和 API,覆蓋從底層內核開發到上層應用部署的完整開發流程,廣泛適用于高性能計算(HPC)、人工智能AI)和機器學習等領域。

ROCm? 特別針對生成式 AI 和 HPC 工作負載進行了深度優化,具備良好的生態系統兼容性和代碼可移植性,能夠幫助開發者快速將基于 CUDA 等平臺的現有項目遷移至 AMD 平臺。無論是以卷積神經網絡(CNN)為核心的預測式 AI 模型(Predictive AI),還是以 Transformer 架構為主的生成式 AI 模型(Generative AI),ROCm 均提供了高效的運行支持。

此外,ROCm? 不僅支持 AMD Radeon 獨立顯卡(dGPU),還兼容集成在 AMD CPU 中的核顯(iGPU),使得開發者能夠在多樣化的硬件環境中靈活部署 AI 模型,實現本地化高效推理與訓練

下表展示PP-OCRv5 Server版模型,經過ROCm?優化后,在AMD HX370上運行的性能。性能測試代碼和的圖片來自于開源項目:

https://github.com/liebedir/PP-OCRv5-AMD-ROCm

二,搭建ROCm?開發環境

首先,請克隆PP-OCRv5_AMD-ROCm到本地

git clone https://github.com/liebedir/PP-OCRv5-AMD-ROCm
cd PP-OCRv5-AMD-ROCm

接著,安裝ROCm?:

wget 
https://repo.radeon.com/amdgpu-install/6.4.3/ubuntu/jammy/amdgpu-install_6.4.60403-1_all.deb

sudo apt install ./amdgpu-install_6.4.60403-1_all.deb

圖片

sudo apt update

圖片

sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)"

圖片

sudo apt install amdgpu-dkms

圖片

圖片

sudo apt install python3-setuptools python3-wheel

圖片

sudo usermod -a -G render,video $LOGNAME # Add the current user to the render and video groups

圖片

sudo apt install rocm

圖片

然后,添加環境變量到~/.bashrc,該環境變量與核顯的架構相關,11.0.0適用于RDNA3架構核顯,其他架構請參考https://github.com/liebedir/PP-OCRv5-AMD-ROCm:

vi ~/.bashrcexport HSA_OVERRIDE_GFX_VERSION=11.0.0

最后,重啟計算機。

完成計算機重啟后,創建python虛擬環境并安裝onnxruntime-rocm

conda create -n ocr-rocm python==3.10
pip3 install onnxruntime-rocm -f https://repo.radeon.com/rocm/manylinux/rocm-rel-6.4.2/

接著,[下載PP-OCRv5模型并導出為onnx格式。]

至此,模型和環境準備完成!

三,編寫PP-OCRv5推理程序

PP-OCRv5-AMD-ROCm項目已將推理程序編寫完成,各文件功能如下:

執行演示程序main.py,并指定模型路徑和推理硬件設備

python main.py --image_dir images/paddleocr_structure.png  
--det_model_dir ../PP-OCRv5_server_det_infer/inference.onnx
--det_model_device GPU 
--rec_model_dir ../PP-OCRv5_server_rec_infer/inference.onnx
--rec_model_device GPU

運行結果,如下圖所示:

四,總結

使用AMD 的開發者可以通過ROCm?軟件棧將PP-OCRv5模型部署到AMD的CPU、獨立顯卡或核顯硬件平臺上。

如果你有更好的文章,歡迎投稿!

稿件接收郵箱:nami.liu@pasuntech.com

更多精彩內容請關注“ 算力魔方^?^ ”!

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AMD顯卡
    +關注

    關注

    0

    文章

    32

    瀏覽量

    11597
  • OCR
    OCR
    +關注

    關注

    0

    文章

    175

    瀏覽量

    17201
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何在ZYNQ本地部署DeepSeek模型

    一個最小號 DeepSeek 模型部署AMD Zynq UltraScale+ MPSoC 處理系統的項目。
    的頭像 發表于 12-19 15:43 ?7578次閱讀
    如何在ZYNQ本地<b class='flag-5'>部署</b>DeepSeek<b class='flag-5'>模型</b>

    ROCm部署PP-StructureV3到AMD GPU

    -StructureV3模型部署方案。該方案是對前文PP-OCRv5部署實踐的深化與擴展。 一,RapidDoc系統概述 RapidDoc 是一個專精于文檔智能解析的輕量級開源框架,集
    的頭像 發表于 11-13 16:56 ?5532次閱讀
    用<b class='flag-5'>ROCm</b><b class='flag-5'>部署</b><b class='flag-5'>PP</b>-StructureV3到<b class='flag-5'>AMD</b> GPU<b class='flag-5'>上</b>

    PP-OCRv5 MCP服務器海光主板的部署與實戰

    在當今數字化快速發展的時代,OCR(光學字符識別)技術已經成為從圖像中提取文本信息的重要工具。無論是自動化辦公、智能文檔處理還是在內容創作領域,OCR 技術的應用都極大地提高了工作效率和準確性
    的頭像 發表于 10-15 17:04 ?825次閱讀
    <b class='flag-5'>PP-OCRv5</b> MCP服務器<b class='flag-5'>在</b>海光主板的<b class='flag-5'>部署</b>與實戰

    Immich智能相冊樹莓派5的高效部署與優化

    海外廣受歡迎的開源智能相冊項目Immich部署于樹莓派5,并通過搭載基于AX650N/AX8850的M.2算力卡,顯著提升了系統算力。借助該方案,我們高效
    的頭像 發表于 10-14 11:30 ?1255次閱讀
    Immich智能相冊<b class='flag-5'>在</b>樹莓派<b class='flag-5'>5</b><b class='flag-5'>上</b>的高效<b class='flag-5'>部署</b>與優化

    DeepSeek模型如何在云服務器上部署

    隨著大型語言模型(LLM)的應用日益普及,許多開發者和企業希望像DeepSeek這樣的優秀模型部署到自己的云服務器,以實現私有化、定制化
    的頭像 發表于 10-13 16:52 ?938次閱讀

    使用OpenVINOPP-OCRv5模型部署Intel顯卡

    是一個用于優化和部署人工智能(AI)模型,提升AI推理性能的開源工具集合,不僅支持以卷積神經網絡(CNN)為核心組件的預測式AI模型(Predictive AI),還支持以Transformer為核心組件的生成式AI
    的頭像 發表于 09-20 11:17 ?1241次閱讀
    使用OpenVINO<b class='flag-5'>將</b><b class='flag-5'>PP-OCRv5</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b><b class='flag-5'>在</b>Intel<b class='flag-5'>顯卡</b><b class='flag-5'>上</b>

    vision board部署模型到openmv的代碼導致連接超時怎么解決?

    env終端中勾選了tiflte support后燒錄mdk到板子后就開始顯示連接不到 無法部署模型
    發表于 09-19 07:59

    一鍵搞定!PP-OCRv5模型轉ONNX格式全攻略,解鎖多平臺無縫部署

    飛槳技術生態伙伴 算力魔方 | 引言:還在為OCR模型不同硬件部署而頭疼嗎?百度飛槳的PP-OCRv5重磅升級,準確率提升13%,且一
    的頭像 發表于 09-05 16:10 ?2184次閱讀
    一鍵搞定!<b class='flag-5'>PP-OCRv5</b><b class='flag-5'>模型</b>轉ONNX格式全攻略,解鎖多平臺無縫<b class='flag-5'>部署</b>

    【EASY EAI Orin Nano開發板試用體驗】PP-OCRV5文字識別實例搭建與移植

    【EASY EAI Orin Nano開發板試用體驗】PP-OCRV5文字識別實例搭建與移植 PP-OCRV5PP-OCR新一代文字識別解決方案, 該方案聚焦于多場景、多文字類型的文字識別。
    發表于 08-18 16:57

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀元!代碼已經開源,一起來試試!

    AMD7900xtxonSOPHGOSG2044PCLT團隊傾注心血,精心完成了ROCm軟件棧適配到SG2044獨特架構的復雜工作。這包括:內核級適配:確保ROCm驅動程序和底層組
    的頭像 發表于 07-14 17:04 ?1198次閱讀
    <b class='flag-5'>ROCm</b> 6.2.4 成功移植至 SG2044: 大<b class='flag-5'>模型</b><b class='flag-5'>部署</b>速率飆升,RISC-V + AI 新紀元!代碼已經開源,一起來試試!

    基于算力魔方與PP-OCRv5的OpenVINO智能文檔識別方案

    )團隊最新推出的PP-OCRv5模型精度和效率實現了顯著突破,結合Intel OpenVINO工具套件的硬件加速能力,能夠為各類文檔處理場景提供更強大的支持。 二,算力魔方簡介 算
    的頭像 發表于 06-12 21:19 ?1635次閱讀
    基于算力魔方與<b class='flag-5'>PP-OCRv5</b>的OpenVINO智能文檔識別方案

    V2板子上部署豆包模型調試指南

    V2板子上部署豆包模型調試指南 準備階段 首先,可以觀看大模型實戰(SC171開發套件V3)并下載工程源碼,之后我們需要在板子安裝這個代
    發表于 05-25 10:17

    如何使用Docker部署模型

    隨著深度學習和大模型的快速發展,如何高效地部署這些模型成為了一個重要的挑戰。Docker 作為一種輕量級的容器化技術,能夠模型及其依賴環境
    的頭像 發表于 05-24 16:39 ?1113次閱讀

    使用OpenVINO優化并部署飛槳PP-OCRv4模型

    算法,在此基礎打造產業級特色模型系列:PP-OCR、PP-Structure和PP-ChatOCR,打通了
    的頭像 發表于 04-03 18:07 ?2587次閱讀
    使用OpenVINO優化并<b class='flag-5'>部署</b>飛槳<b class='flag-5'>PP-OCRv</b>4<b class='flag-5'>模型</b>

    DeepSeek昇騰模型部署的常見問題及解決方案

    開發者。 本文將為你詳細闡述昇騰DeepSeek模型部署的優秀實踐。 昇騰DeepSeek模型部署的常見問題及解決方案見: DeepSeek
    的頭像 發表于 03-25 16:53 ?2415次閱讀
    DeepSeek<b class='flag-5'>在</b>昇騰<b class='flag-5'>上</b>的<b class='flag-5'>模型</b><b class='flag-5'>部署</b>的常見問題及解決方案