国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

PaddleOCR歷史表現回顧

新機器視覺 ? 來源:CSDN ? 作者:CSDN ? 2021-04-15 14:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、導讀

OCR方向的工程師,一定需要知道這個OCR開源項目:PaddleOCR

短短半年時間,累計Star數量已超過11.5K,

頻頻登上Github Trending和Paperswithcode 日榜月榜第一,

在《Github 2020數字洞察報告》中被評為中國Github Top20活躍項目。

稱它為 OCR方向目前最火的repo絕對不為過。

最近,它又帶來兩項全新發布:

AAAI 2021 頂會論文開源:PGNet: Real-time Arbitrarily-Shaped Text Spotting with Point Gathering Network 提出了一種簡單且有效的任意方向端到端文本識別模型,在精度可比的基礎上,與之前大火的ABCNet相比,預測速度快了三倍,達到SOTA效果。

多語言支持種類提升至80+種:基本覆蓋國際主流語言種類,在開源測試集MLT2017評估,中文、韓文、日文、拉丁語系、阿拉伯語系,識別效果均顯著優于EasyOCR,開源SOTA效果。

二、PaddleOCR歷史表現回顧

先看下PaddleOCR自去年6月開源以來,短短幾個月在GitHub上的表現:

2020年6月,8.6M超輕量模型發布,GitHub Trending 全球趨勢榜日榜第一。

2020年8月,開源CVPR2020頂會算法,再上GitHub趨勢榜單!

2020年10月,發布PP-OCR算法,開源3.5M超超輕量模型,再下Paperswithcode 趨勢榜第一

2021年1月,發布Style-Text文本合成算法,PPOCRLabel數據標注工具,star數量突破10000+,截至目前已經達到11.5k,在《Github 2020數字洞察報告》中被評為中國Github Top20活躍項目。

e7b9998a-9cdd-11eb-8b86-12bb97331649.gif


這個含金量,廣大的GitHub開發者們自然懂

超輕量模型的效果:火車票、表格、金屬銘牌、翻轉圖片、外語都是妥妥的,

e7c6ba70-9cdd-11eb-8b86-12bb97331649.gif

動靜統一的開發體驗

動態圖和靜態圖是深度學習框架常用的兩種模式。在動態圖模式下,代碼編寫運行方式符合Python程序員的習慣,易于調試,但在性能方面, Python執行開銷較大,與C++有一定差距。

相比動態圖,靜態圖在部署方面更具有性能的優勢。靜態圖程序在編譯執行時,預先搭建好的神經網絡可以脫離Python依賴,在C++端被重新解析執行,而且擁有整體網絡結構也能進行一些網絡結構的優化。

飛槳動態圖中新增了動態圖轉靜態圖的功能,支持用戶使用動態圖編寫組網代碼。預測部署時,飛槳會對用戶代碼進行分析,自動轉換為靜態圖網絡結構,兼顧了動態圖易用性和靜態圖部署性能兩方面優勢。

文本合成工具Style-Text效果:相比于傳統的數據合成算法,Style-Text可以實現特殊背景下的圖片風格遷移,只需要少許目標場景圖像,就可以合成大量數據,效果展示如下:

e83d58e2-9cdd-11eb-8b86-12bb97331649.png

半自動標注工具PPOCRLabel:通過內置高質量的PPOCR中英文超輕量預訓練模型,可以實現OCR數據的高效標注。CPU機器運行也是完全沒問題的。效果演示如下:

e85051ea-9cdd-11eb-8b86-12bb97331649.gif

用法也是非常的簡單,標注效率提升60%-80%是妥妥的。

傳送門:

Github:https://github.com/PaddlePaddle/PaddleOCR

那么最近的2021年4月份更新,又給大家帶來哪些驚喜呢?

三、AAAI 2021 頂會論文:端到端SOTA算法PGNet開源:

直接先看指標評測表現:PGNet算法在ICDAR2015數據集上的檢測及端到端性能表現,在精度接近的條件下,速度上與之前大火的ABCNet相比翻了三倍,達到了SOTA的效果。

e92bad3a-9cdd-11eb-8b86-12bb97331649.png

圖1:PGNet模型的速度與精度性能對比

詳細數據指標:

e936e65a-9cdd-11eb-8b86-12bb97331649.png

表1:ICDAR2015數據集上的檢測及端到端性能

PGNet提出的方法框架如下圖所示,輸入的圖象經過Backbone網絡得到1/4下采樣特征圖,通過多任務學習,同時回歸四個任務的內容,包括文本邊緣偏移量預測(TBO),文本中心線預測(TCL),文本方向偏移量預測(TDO)以及文本字符分類圖預測(TCC)。其中文本行的檢測結果由TBO以及TCL經過后處理得到,文本行的識別結果由TCL,TDO以及TCC的輸出得到。

e94c2998-9cdd-11eb-8b86-12bb97331649.png

圖2 網絡流程框架

在ICDAR2015以及Total-Text數據集上可以看一下模型效果:

e9572848-9cdd-11eb-8b86-12bb97331649.png

圖3Total-Text及ICDAR2015數據集可視化效果圖

PGNet論文地址:https://www.aaai.org/AAAI21Papers/AAAI-2885.WangP.pdf

【基于頂尖算法,開放拿來即用的成熟印章識別能力】同時,基于PGNet研發的印章識別能力已經在百度AI開放平臺開放,可以有效檢測并識別合同文件或常用票據中的印章,輸出文字內容、印章位置信息以及相關置信度,已支持圓形章、橢圓形章、方形章等常見印章。提供標準化API接口,快速集成,同時支持私有化部署至本地,保障業務數據私密性。

ea1bdd82-9cdd-11eb-8b86-12bb97331649.gif

開放能力地址:https://ai.baidu.com/tech/ocr/seal

注:此處非模型直接開源,但可以申請免費試用。

四、豐富的多語言種類支持,目前已經支持全球80+ 語言模型

簡單對比一下目前主流OCR方向開源repo的核心能力:

中英文模型性能及功能對比

ea4c7a82-9cdd-11eb-8b86-12bb97331649.jpg

其中,部分多語言模型性能及功能(F1-Score)對比(僅EasyOCR提供)

ea5daa0a-9cdd-11eb-8b86-12bb97331649.png

模型效果

ea671720-9cdd-11eb-8b86-12bb97331649.gif


值得一提的是,目前已經有全球開發者通過PR或者issue的方式為PaddleOCR提供多語言的字典和語料,在PaddleOCR上已經完成了全球80+ 主流語言的廣泛覆蓋:包括中文簡體、中文繁體、英文、法文、德文、韓文、日文、意大利文、西班牙文、葡萄牙文、俄羅斯文、阿拉伯文、印地文、維吾爾文、波斯文、烏爾都文、塞爾維亞文(latin)、歐西坦文、馬拉地文、尼泊爾文、塞爾維亞文、保加利亞文、烏克蘭文、白俄羅斯文、泰盧固文、卡納達文、泰米爾文,也歡迎更多開發者可以參與共建。

五、良心出品的中英文文檔教程

ea9e056e-9cdd-11eb-8b86-12bb97331649.png


別的不需要多說了,大家訪問GitHub點過star之后自己體驗吧:https://github.com/PaddlePaddle/PaddleOCR

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 語言模型
    +關注

    關注

    0

    文章

    571

    瀏覽量

    11310
  • python
    +關注

    關注

    57

    文章

    4876

    瀏覽量

    90025
  • 開源項目
    +關注

    關注

    0

    文章

    38

    瀏覽量

    7603

原文標題:Github Star 11.5K項目再發版:AAAI 2021 頂會論文開源,80+多語言模型全新升級

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    沐曦曦云C500/C550 GPU產品適配PaddleOCR-VL-1.5模型

    PaddleOCR-VL 系列的全新迭代版本PaddleOCR-VL-1.5今天正式上線,沐曦曦云C500/C550 Day 0 適配PaddleOCR-VL-1.5模型,助力PaddleOC
    的頭像 發表于 01-30 10:19 ?741次閱讀
    沐曦曦云C500/C550 GPU產品適配<b class='flag-5'>PaddleOCR</b>-VL-1.5模型

    百度正式發布并開源新一代文檔解析模型PaddleOCR-VL-1.5

    1 月 29 日,百度正式發布并開源新一代文檔解析模型 PaddleOCR-VL-1.5。該模型以僅 0.9B 參數的輕量架構,在全球權威文檔解析評測榜單 OmniDocBench V1.5 中取得
    的頭像 發表于 01-30 10:03 ?585次閱讀
    百度正式發布并開源新一代文檔解析模型<b class='flag-5'>PaddleOCR</b>-VL-1.5

    北汽集團2025年度高光時刻回顧

    1月9日,北汽集團公布2025年成績單。過去一年,北汽集團實現整車銷量175.2萬輛,同比增長5.6%,自主品牌銷量達107萬輛,新能源及國際業務表現亮眼,增速均大幅跑贏行業,創歷史新高。“三年躍升行動”開局之年,北汽集團已初步實現結構重塑與質的跨越,站上了全新的發展臺階
    的頭像 發表于 01-12 16:06 ?325次閱讀

    使用 Docker 一鍵部署 PaddleOCR-VL: 新手保姆級教程

    作者:飛槳開發者技術專家 劉力 | 適合人群:剛接觸 PaddleOCR-VL + Docker部署的同學 | 學習目標:從一臺剛裝好的 Ubuntu 24.04 開始,完成 Docker 環境準備
    的頭像 發表于 12-18 18:26 ?6427次閱讀
    使用 Docker 一鍵部署 <b class='flag-5'>PaddleOCR</b>-VL: 新手保姆級教程

    Shell歷史命令history用法

    1. 顯示歷史命令列表 「介紹」:history 命令用于顯示當前會話中執行過的命令的列表,以及每個命令對應的編號。「示例代碼」:history 2. 使用歷史命令重復執行命令 「介紹」:通過
    發表于 12-02 06:10

    國芯微Pegasus芯片榮膺2025“中國芯”優秀市場表現產品獎

    杭州國芯微電子股份有限公司(以下簡稱“國芯微”)自主研發的“衛星廣播與流媒體智能終端SoC芯片Pegasus”榮膺第二十屆“中國芯”優秀市場表現產品獎!這是國芯微歷史上第11次問鼎中國芯片行業最受矚目的“中國芯”獎項,標志著公司在技術創新與市場開拓上的持續領先地位。
    的頭像 發表于 11-19 09:32 ?663次閱讀
    國芯微Pegasus芯片榮膺2025“中國芯”優秀市場<b class='flag-5'>表現</b>產品獎

    基于全局預測歷史的gshare分支預測器的實現細節

    GShare預測機制簡介 GShare預測機制作為一種常用的分支預測機制,通過基于分支歷史和分支地址來預測分支指令的執行路徑。分支歷史是指處理器在執行程序時遇到的所有分支指令的執行情況,包括它們
    發表于 10-22 06:50

    橫河示波器DLM3000歷史存儲與統計功能

    工程師除了需要測量常規單周期開關損耗,還需要關注多周期開啟損耗和關閉損耗。這需要用到示波器的歷史存儲與統計功能。DLM3000可以在高速波形捕獲基礎上對數據進行歷史存儲。
    的頭像 發表于 09-17 17:28 ?715次閱讀
    橫河示波器DLM3000<b class='flag-5'>歷史</b>存儲與統計功能

    精準定位性能瓶頸:深入解析 PaddleOCR v3.2 全新 Benchmark 功能

    飛槳技術生態伙伴 算力魔方 | 摘要:在實際落地OCR和文檔解析項目時,大家常常會遇到一個棘手問題:模型跑得不夠快,但到底是檢測太慢、識別耗時,還是模塊之間的數據流轉不高效?PaddleOCR
    的頭像 發表于 09-05 16:02 ?1177次閱讀
    精準定位性能瓶頸:深入解析 <b class='flag-5'>PaddleOCR</b> v3.2 全新 Benchmark 功能

    長城汽車2025年8月大事記回顧

    長城汽車2025年第二季度營收523.16億元,同比增長7.72%,環比增長30.73%,為歷史最佳第二季度營收表現;二季度凈利潤45.86億元,同比增長19.42%,環比增長161.87%,為歷史
    的頭像 發表于 09-01 09:30 ?958次閱讀

    小語種OCR標注效率提升10+倍:PaddleOCR+ERNIE 4.5自動標注實戰解析

    摘要 :小語種OCR研發的核心瓶頸在于高質量標注數據的稀缺與高昂成本。本文介紹一種創新的自動化標注方案,利用 PaddleOCR 進行文本檢測與裁剪,并調用 ERNIE 4.5 大模型進行雙重預測
    的頭像 發表于 08-29 11:26 ?3635次閱讀
    小語種OCR標注效率提升10+倍:<b class='flag-5'>PaddleOCR</b>+ERNIE 4.5自動標注實戰解析

    【EASY EAI Orin Nano開發板試用體驗】PP-OCRV5文字識別實例搭建與移植

    用PP-OCRV5,首先就是要安裝PaddlePaddle 3.0(飛槳)和PaddleOCR 3.0(飛槳OCR大模型),這兩個軟件要通過Python進行安裝,這里為了省事,我直接在別的ARM64開發板(野火
    發表于 08-18 16:57

    C語言的歷史及程序介紹

    電子發燒友網站提供《C語言的歷史及程序介紹.pdf》資料免費下載
    發表于 04-09 16:10 ?0次下載

    使用OpenVINO優化并部署飛槳PP-OCRv4模型

    作者:算力魔方創始人/英特爾創新大使劉力 一,什么是PaddleOCR工具庫? PaddleOCR 旨在打造一套豐富、領先、且實用的 OCR 工具庫,助力開發者訓練出更好的模型,并應用落地。在
    的頭像 發表于 04-03 18:07 ?2583次閱讀
    使用OpenVINO優化并部署飛槳PP-OCRv4模型

    FRED的光路和光路歷史記錄

    對于雜散光分析,通常會使用“高級光線追跡”對話框,并選擇“創建/使用光線歷史文件”和“確定光路”選項。下面是對這兩個選項的簡要解釋。 確定光線路徑 選擇此選項會使得FRED存儲所有光路信息。這允許
    發表于 03-07 08:55