OCR (光學(xué)字符識別)是指電子設(shè)備(例如掃描儀或數(shù)碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程;即,針對印刷體字符,采用光學(xué)的方式將紙質(zhì)文檔中的文字轉(zhuǎn)換成為黑白點陣的圖像文件,并通過識別軟件將圖像中的文字轉(zhuǎn)換成文本格式,供文字處理軟件進一步編輯加工的技術(shù)。如何除錯或利用輔助信息提高識別正確率,是OCR最重要的課題,ICR的名詞也因此而產(chǎn)生。衡量一個OCR系統(tǒng)性能好壞的主要指標有:拒識率、誤識率、識別速度、用戶界面的友好性,產(chǎn)品的穩(wěn)定性,易用性及可行性等。
ocr識別的過程如下:
1、圖像輸入:要進行ocr識別,第一步便要采集所要識別的圖像,可以是名片、身份證、護照、行駛證、駕駛證、公文、文檔等等都可以,然后將圖像輸入到識別核心。
2、圖像預(yù)處理:此過程包含二值化(將圖像上的像素點灰度值設(shè)置為0或255,也就是將整個圖像呈現(xiàn)出明顯的只有黑和白的視覺效果)、去噪、傾斜度矯正等。
3、版面分析:將所要識別的文檔分段、分行處理
4、字符切割:此時需要字符定位和字符切割,定位出字符串的邊界,然后分別對字符串進行單個切割,單個分割出來的字符再做識別。
5、字符特征提取:提取字符特征,為后面的識別提供依據(jù)。
6、字符識別:將當(dāng)前字符提取的特征向量與特征模板庫進行模板粗分類和模板細匹配,識別出字符。
7、版面回復(fù):將識別結(jié)果按照原來的版面排班,輸出Word或pdf格式的文檔。
8、后處理校正: 根據(jù)特定的語言上下文的關(guān)系,對識別結(jié)果進行較正的算法。
-
字符識別
+關(guān)注
關(guān)注
0文章
18瀏覽量
8923 -
OCR
+關(guān)注
關(guān)注
0文章
175瀏覽量
17199
發(fā)布評論請先 登錄
友思特案例 | 金屬行業(yè)視覺檢測案例四:挖掘機鋼板表面光學(xué)字符識別(OCR)檢測
瑞芯微(EASY EAI)RV1126B OCR文字識別
ElfBoard技術(shù)貼|如何在【RK3588】ELF 2開發(fā)板上完成PPOC本地化部署
藥品包裝壓印字符識別檢測難度大?PMS光度立體融合技術(shù)來破局!
【嘉楠堪智K230開發(fā)板試用體驗】+OCR實現(xiàn)
如何利用OCR技術(shù)實現(xiàn)高效集裝箱箱號識別?
端側(cè)OCR文字識別實現(xiàn) -- Core Vision Kit ##HarmonyOS SDK AI##
即插即用、缺陷同檢,維視智造推出讀碼/字符檢測視覺系統(tǒng)新品
OCR技術(shù)如何實現(xiàn)鐵路集裝箱號的自動識別?
OCR技術(shù)vs傳統(tǒng)識別:哪種更適合火車集裝箱識別?
OCR識別訓(xùn)練完成后給的是空壓縮包,為什么?
孚為智能采用多角度高清攝像與智能OCR技術(shù),實現(xiàn)集裝箱號碼全自動識別。#集裝箱號ocr識別
大模型預(yù)標注和自動化標注在OCR標注場景的應(yīng)用
手持終端集裝箱識別系統(tǒng)的圖像識別技術(shù)
阿普奇視覺控制器AK7在OCR識別場景中的應(yīng)用
OCR光學(xué)字符識別技術(shù)原理講解
評論