国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

百度正式發布并開源新一代文檔解析模型PaddleOCR-VL-1.5

OSC開源社區 ? 來源:OSC開源社區 ? 2026-01-30 10:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1 月 29 日,百度正式發布并開源新一代文檔解析模型 PaddleOCR-VL-1.5。該模型以僅 0.9B 參數的輕量架構,在全球權威文檔解析評測榜單 OmniDocBench V1.5 中取得全球綜合性能第一成績,整體精度達到 94.5%,超過 Gemini-3-Pro、DeepSeek-OCR2、Qwen3-VL-235B-A22B、GPT-5.2 等模型。

值得關注的是,PaddleOCR-VL-1.5 全球首次實現 OCR 模型的“異形框定位”能力,使機器能夠精準識別傾斜、彎折、拍照畸變等非規則文檔形態,首次讓“歪文檔”實現穩定、可規模化解析。該技術解決了傳統 OCR 模型在移動拍照、掃描件變形、復雜光照等真實場景中因文檔形變導致的識別失敗問題,可廣泛應用于金融票據處理、檔案數字化、政務文檔流轉等場景。

PaddleOCR-VL-1.5 基于文心大模型進行開發,在 OmniDocBench V1.5 多個關鍵指標上取得領先表現。其中,表格結構理解(92.8 分)和閱讀順序預測(95.8 分)兩項核心指標上均位列第一,分別領先 Gemini-3-Pro、DeepSeek-OCR 等主流模型 2–5 分不等。在文檔閱讀順序預測任務中,其版面邏輯解析錯誤率僅為同類其他模型約一半。這表明,PaddleOCR-VL-1.5 在復雜文檔結構還原與版面邏輯理解方面具備更高穩定性,在合同、財報等高復雜度業務場景中擁有更高可用性。

2025 年 10 月 16 日,百度首次發布并開源 PaddleOCR-VL 模型,在 OmniDocBench V1.5 榜單中取得全球 SOTA 成績,并連續五天登頂 HuggingFace 全球模型總趨勢榜與 ModelScope 全球模型總趨勢榜雙榜第一。

相比于上代,在功能層面,PaddleOCR-VL-1.5 進一步集成印章識別、文本檢測與識別等任務能力,關鍵指標持續領跑;同時針對特殊場景與多語種識別進行系統優化,在生僻字、古籍文獻、多語種表格、下劃線與復選框等復雜結構識別方面顯著提升,并新增對藏語、孟加拉語等語種的支持。模型還支持跨頁表格自動合并與跨頁段落標題識別,有效解決長文檔解析中的結構斷裂問題。

近半年來,全球主流模型廠商密集布局 OCR 領域。1 月 27 日,深度求索發布新一代 OCR 模型 DeepSeek-OCR-2,引入“因果流查詢”機制,并將語言模型融入視覺編碼,在 OmniDocBench V1.5 中實現 91.09% 精度。與此同時,Mistral AI、字節跳動、騰訊等企業也相繼推出新一代 OCR 模型,行業競爭持續加劇。

業內分析認為,隨著大模型加速進入金融、政務、制造等高復雜度業務流程,文檔解析能力正從“能用”走向“穩定可規模化落地”。PaddleOCR-VL-1.5 在精度、復雜場景適應性與工程化能力上的系統突破,有望進一步降低產業應用門檻,推動 OCR 技術在真實生產環境中的深度落地。

目前,PaddleOCR-VL-1.5 已全面開源,開發者可通過 GitHub、Hugging Face 獲取,并在 PaddleOCR 官網進行在線體驗或通過百度智能云千帆平臺調用 API 接口

在線使用/API:

https://www.paddleocr.com

開源項目地址

https://github.com/PaddlePaddle/PaddleOCR

模型下載地址:

https://huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 百度
    +關注

    關注

    9

    文章

    2377

    瀏覽量

    94859
  • 開源
    +關注

    關注

    3

    文章

    4203

    瀏覽量

    46122
  • 模型
    +關注

    關注

    1

    文章

    3751

    瀏覽量

    52099

原文標題:性能超越DeepSeek-OCR2,百度發布并開源新一代SOTA OCR模型

文章出處:【微信號:OSC開源社區,微信公眾號:OSC開源社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    智譜AI正式上線開源新一代模型GLM-5

    智譜AI正式上線開源新一代模型GLM-5。作為面向復雜系統工程與長程Agent任務打造的新一代模型
    的頭像 發表于 02-12 14:40 ?684次閱讀

    沐曦曦云C500/C550 GPU產品適配PaddleOCR-VL-1.5模型

    PaddleOCR-VL 系列的全新迭代版本PaddleOCR-VL-1.5今天正式上線,沐曦曦云C500/C550 Day 0 適配PaddleOCR-VL-1.5模型,助力
    的頭像 發表于 01-30 10:19 ?737次閱讀
    沐曦曦云C500/C550 GPU產品適配<b class='flag-5'>PaddleOCR-VL-1.5</b><b class='flag-5'>模型</b>

    百度文心大模型5.0正式版上線

    今天,在百度文心Moment大會現場,文心大模型5.0正式版上線。
    的頭像 發表于 01-23 16:48 ?1279次閱讀

    使用 Docker 鍵部署 PaddleOCR-VL: 新手保姆級教程

    → 拉起 PaddleOCR-VL 服務 → 本機用 HTTP 調用 /layout-parsing 接口跑通文檔解析PaddleOCR-
    的頭像 發表于 12-18 18:26 ?6420次閱讀
    使用 Docker <b class='flag-5'>一</b>鍵部署 <b class='flag-5'>PaddleOCR-VL</b>: 新手保姆級教程

    商湯科技正式發布開源全新多模態模型架構NEO

    商湯科技正式發布開源了與南洋理工大學S-Lab合作研發的全新多模態模型架構 —— NEO,為日日新SenseNova 多模態模型奠定了
    的頭像 發表于 12-08 11:19 ?1014次閱讀
    商湯科技正式<b class='flag-5'>發布</b><b class='flag-5'>并</b><b class='flag-5'>開源</b>全新多模態<b class='flag-5'>模型</b>架構NEO

    新一代AtomGit平臺暨人工智能開源社區發布

    、數據集及異構算力資源,共同打造中立、開放、公益的新一代開源+人工智能”體化基礎設施平臺——AtomGit,正式發布人工智能開源社區。
    的頭像 發表于 10-30 09:46 ?621次閱讀

    寧暢與與百度文心大模型展開深度技術合作

    近日,百度正式開源文心大模型4.5系列模型。作為文心開源合作伙伴,寧暢在模型
    的頭像 發表于 07-07 16:26 ?869次閱讀

    65%央企大模型落地首選百度智能云

    今天,很榮幸地分享個好消息,百度智能云已牽手65%的央企,共同推進大模型產業落地。得益于全棧的AI能力,百度聯合眾多央國企伙伴,針對各類不同業務場景,打造了
    的頭像 發表于 06-11 15:44 ?888次閱讀

    百度地圖重磅發布地圖AI開放平臺

    近日,在WGDC25全球時空智能大會上,百度地圖重磅發布地圖AI開放平臺。百度地圖深耕20年的數據能力、引擎能力與AI技術全面開放,向開發者深度開放四大核心能力和五大場景解決方案。
    的頭像 發表于 05-26 11:26 ?1735次閱讀

    百度文心大模型X1 Turbo獲得信通院當前大模型最高評級證書

    百度在520居然還領了個證?是它, 信通院當前大模型最高評級證書 ! 在5月20日的百度AI Day 上,中國信通院公布了大模型推理能力評估結果——
    的頭像 發表于 05-21 18:19 ?1267次閱讀
    <b class='flag-5'>百度</b>文心大<b class='flag-5'>模型</b>X1 Turbo獲得信通院當前大<b class='flag-5'>模型</b>最高評級證書

    百度發布2025年Q1財報 蘿卜快跑季度全球訂單超140萬

    今天5月21日,百度發布了2025年Q1業績。?百度在2025年季度總營收達到325億元,百度核心收入255億元,同比增長7%。歸屬
    的頭像 發表于 05-21 18:17 ?2726次閱讀
    <b class='flag-5'>百度</b><b class='flag-5'>發布</b>2025年Q1財報 蘿卜快跑<b class='flag-5'>一</b>季度全球訂單超140萬

    百度智能云兩大基礎設施再升級

    近日,在Create2025百度AI開發者大會上,沈抖分享了百度智能云在智能基礎設施建設方面的最新成果,并在算力、模型及應用等方面發布系列
    的頭像 發表于 04-30 10:20 ?1042次閱讀

    百度發布文心4.5 Turbo、X1 Turbo和多款AI應用

    近日,Create2025百度AI開發者大會在武漢舉辦。百度創始人李彥宏發布了文心大模型4.5 Turbo及深度思考模型X1 Turbo兩大
    的頭像 發表于 04-30 10:16 ?1141次閱讀

    百度飛槳框架3.0正式版發布

    模型訓練成本高?推理效率低?硬件適配難? 4月1日,百度發布 飛槳框架3.0正式版 !五大特性專為大模型設計。 作為大模型時代的Infra
    的頭像 發表于 04-02 19:03 ?1186次閱讀
    <b class='flag-5'>百度</b>飛槳框架3.0正式版<b class='flag-5'>發布</b>

    百度發布文心大模型4.5和文心大模型X1

    文心大模型4.5是百度自主研發的新一代原生多模態基礎大模型,通過多個模態聯合建模實現協同優化,多模態理解能力優秀;具備更精進的語言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯
    的頭像 發表于 03-18 16:29 ?897次閱讀