資料介紹
軟件簡介
由 TensorFlow 2 和 PyTorch 提供支持,任何人都可以無縫訪問光學(xué)字符識別
獲取預(yù)訓(xùn)練模型
使用兩階段方法在 docTR 中實現(xiàn)端到端 OCR:文本檢測(定位單詞),然后文本識別(識別單詞中的所有字符)。因此,可以從可用實現(xiàn)列表中選擇用于文本檢測的架構(gòu)和用于文本識別的架構(gòu)。
from doctr.models import ocr_predictor model = ocr_predictor(det_arch='db_resnet50', reco_arch='crnn_vgg16_bn', pretrained=True)
讀取文件
可以從 PDF 或圖像解釋文檔:
from doctr.io import DocumentFile # PDF pdf_doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images() # Image single_img_doc = DocumentFile.from_images("path/to/your/img.jpg") # Webpage webpage_doc = DocumentFile.from_url("https://www.yoursite.com").as_images() # Multiple page images multi_img_doc = DocumentFile.from_images(["path/to/page1.jpg", "path/to/page2.jpg"])
以默認(rèn)的預(yù)訓(xùn)練模型為例:
from doctr.io import DocumentFile from doctr.models import ocr_predictor model = ocr_predictor(pretrained=True) # PDF doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images() # Analyze result = model(doc)
安裝
安裝 docTR 需要 Python 3.6(或更高版本)和?pip。
由于使用了?weasyprint,如果沒有運(yùn)行在 Linux 系統(tǒng)之上,將需要額外的依賴項。
對于 macOS 用戶,可以按如下方式安裝它們:
brew install cairo pango gdk-pixbuf libffi
對于 Windows 用戶,這些依賴項包含在 GTK 中。
最新版本
可以使用?pypi?安裝最新版本的軟件包,如下所示:
pip install python-doctr
- 樹洞OCR文字識別跨平臺的OCR小工具
- 基于LSTM的表示學(xué)習(xí)-文本分類模型 18次下載
- 基于主題分布優(yōu)化的模糊文本分類方法 5次下載
- 基于殘差連接的改進(jìn)端到端文本識別網(wǎng)絡(luò)結(jié)構(gòu) 6次下載
- 基于LSTM的流式文檔結(jié)構(gòu)識別方法 7次下載
- 膠囊網(wǎng)絡(luò)在短文本多種意圖識別的應(yīng)用及研究 10次下載
- 基于BP神經(jīng)網(wǎng)絡(luò)分類器的垃圾文本過濾模型 43次下載
- 基于神經(jīng)網(wǎng)絡(luò)的中文文本蘊(yùn)含識別模型 7次下載
- 新型中文旅游文本命名實體識別設(shè)計方案 24次下載
- 使用數(shù)字識別和AI實現(xiàn)OCR的資料合集 20次下載
- OCR文字識別視覺檢測系統(tǒng)應(yīng)用程序免費(fèi)下載 27次下載
- API-Shop-OCR-營業(yè)執(zhí)照識別API接口Python調(diào)用示例代碼說明 6次下載
- 基于文本分類計數(shù)識別平臺設(shè)計(JAVA實現(xiàn)) 11次下載
- 串口屏技術(shù)文檔—文本限值提示如何修改為英文 14次下載
- 免費(fèi)版文字識別系統(tǒng) TH-OCR SDK11.0 0次下載
- 把樹莓派打造成識別文本的“神器”! 830次閱讀
- 光學(xué)識別字符是自動識別技術(shù)嗎 1.3k次閱讀
- 光學(xué)識別的過程包含哪些 1.2k次閱讀
- 基于OpenVINO+OpenCV的OCR處理流程化實現(xiàn) 1.4k次閱讀
- 可以提取圖像文本的5大Python庫 4.8k次閱讀
- Tesseract的進(jìn)階用法和最佳實踐 2.3k次閱讀
- OCR實戰(zhàn)教程 2k次閱讀
- 如何將PP-OCRv3英文識別模型部署在Corstone-300虛擬硬件平臺上 3.5k次閱讀
- OCR算法能較好識別水平排布的常規(guī)文本 1.9k次閱讀
- 如何使用Python開發(fā)截圖識別OCR的小工具 4.2k次閱讀
- 如何實現(xiàn)自動識別并提取圖片中的文本內(nèi)容 1.6w次閱讀
- ocr技術(shù)是什么?新能源充電樁應(yīng)用車牌識別ocr技術(shù) 3k次閱讀
- Facebook研究人員提出了一個大規(guī)模圖像文本提取和識別系統(tǒng)——Rosetta 3.8k次閱讀
- 如何使用EAST文本檢測器在自然場景下檢測文本 1.2w次閱讀
- 基于FPGA異構(gòu)加速的OCR識別技術(shù)解析 3.6k次閱讀
下載排行
本周
- 1新一代網(wǎng)絡(luò)可視化(NPB 2.0)
- 3.40 MB | 1次下載 | 免費(fèi)
- 2冷柜-電氣控制系統(tǒng)講解
- 13.68 MB | 1次下載 | 10 積分
- 3MDD品牌三極管MMBT3906數(shù)據(jù)手冊
- 2.33 MB | 次下載 | 免費(fèi)
- 4MDD品牌三極管S9012數(shù)據(jù)手冊
- 2.62 MB | 次下載 | 免費(fèi)
- 5LAT1218 如何選擇和設(shè)置外部晶體適配 BlueNRG-X
- 0.60 MB | 次下載 | 3 積分
- 6LAT1216 Blue NRG-1/2 系列芯片 Flash 操作與 BLE 事件的互斥處理
- 0.89 MB | 次下載 | 3 積分
- 7收音環(huán)繞擴(kuò)音機(jī) AVR-1507手冊
- 2.50 MB | 次下載 | 免費(fèi)
- 8MS1000TA 超聲波測量模擬前端芯片技術(shù)手冊
- 0.60 MB | 次下載 | 免費(fèi)
本月
- 1愛華AIWA HS-J202維修手冊
- 3.34 MB | 37次下載 | 免費(fèi)
- 2PC5502負(fù)載均流控制電路數(shù)據(jù)手冊
- 1.63 MB | 23次下載 | 免費(fèi)
- 3NB-IoT芯片廠商的資料說明
- 0.31 MB | 22次下載 | 1 積分
- 4UWB653Pro USB口測距通信定位模塊規(guī)格書
- 838.47 KB | 5次下載 | 免費(fèi)
- 5蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
- 0.04 MB | 4次下載 | 1 積分
- 6蘇泊爾DCL6909(即CHK-S009)單芯片電磁爐原理圖資料
- 0.08 MB | 2次下載 | 1 積分
- 7100W準(zhǔn)諧振反激式恒流電源電路圖資料
- 0.09 MB | 2次下載 | 1 積分
- 8FS8025B USB的PD和OC快充協(xié)議電壓誘騙控制器IC技術(shù)手冊
- 1.81 MB | 1次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935137次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191439次下載 | 10 積分
- 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183353次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81602次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73822次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App





創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評論