丁香婷婷综合久久来来去,国精产品一二三区美女久久久,久久久精品电影一区二区三区

OCR （光學(xué)字符識別）是指電子設(shè)備（例如掃描儀或數(shù)碼相機）檢查紙上打印的字符，通過檢測暗、亮的模式確定其形狀，然后用字符識別方法將形狀翻譯成計算機文字的過程；即，針對印刷體字符，采用光學(xué)的方式將紙質(zhì)文檔中的文字轉(zhuǎn)換成為黑白點陣的圖像文件，并通過識別軟件將圖像中的文字轉(zhuǎn)換成文本格式，供文字處理軟件進一步編輯加工的技術(shù)。如何除錯或利用輔助信息提高識別正確率，是OCR最重要的課題，ICR的名詞也因此而產(chǎn)生。衡量一個OCR系統(tǒng)性能好壞的主要指標有：拒識率、誤識率、識別速度、用戶界面的友好性，產(chǎn)品的穩(wěn)定性，易用性及可行性等。

ocr識別的過程如下：

1、圖像輸入：要進行ocr識別，第一步便要采集所要識別的圖像，可以是名片、身份證、護照、行駛證、駕駛證、公文、文檔等等都可以，然后將圖像輸入到識別核心。

2、圖像預(yù)處理：此過程包含二值化（將圖像上的像素點灰度值設(shè)置為0或255，也就是將整個圖像呈現(xiàn)出明顯的只有黑和白的視覺效果）、去噪、傾斜度矯正等。

3、版面分析：將所要識別的文檔分段、分行處理

4、字符切割：此時需要字符定位和字符切割，定位出字符串的邊界，然后分別對字符串進行單個切割，單個分割出來的字符再做識別。

5、字符特征提取：提取字符特征，為后面的識別提供依據(jù)。

6、字符識別：將當(dāng)前字符提取的特征向量與特征模板庫進行模板粗分類和模板細匹配，識別出字符。

7、版面回復(fù)：將識別結(jié)果按照原來的版面排班，輸出Word或pdf格式的文檔。

8、后處理校正：根據(jù)特定的語言上下文的關(guān)系，對識別結(jié)果進行較正的算法。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

字符識別

字符識別

+關(guān)注

關(guān)注
0

文章
18

瀏覽量
8923
OCR

OCR

+關(guān)注

關(guān)注
0

文章
175

瀏覽量
17199

搜索歷史

OCR光學(xué)字符識別技術(shù)原理講解

評論