基于 NVIDIA Nemotron 開放模型的 AI 驅動文檔智能,增強科學研究、金融和法律等領域工作流。
智能文檔處理是一種由 AI 驅動的工作流,可以自動讀取、理解文檔并從中提取見解。它依托 AI 智能體和檢索增強生成 (RAG) 等技術,解析文檔中的多種格式(包括表格、圖編者注:本文是Nemotron Labs系列博客文章,探討最新的開放模型、數據集和訓練技術如何幫助企業在 NVIDIA 平臺上構建專用的 AI 系統和應用。每篇文章都強調了在生產中使用開放堆棧來提供價值的實際方法,涵蓋了從透明的研究 copilot 到可擴展的 AI 智能體等領域。
如今,企業面臨著從各種文檔中 (包括報告、演示文稿、PDF、網頁和電子表格) 挖掘寶貴見解的挑戰。
通常,團隊需要通過手動審閱文件、將數據復制到電子表格、構建儀表板,以及使用基本的搜索或模板化的光學字符識別 (OCR) 工具來整理見解,而這些方法往往會遺漏復雜媒體中的重要細節。
智能文檔處理是一種由 AI 驅動的工作流,可以自動讀取、理解文檔并從中提取見解。它依托AI 智能體和檢索增強生成(RAG) 等技術,解析文檔中的多種格式 (包括表格、圖表、圖像和文本),并將多模式內容轉化為易于其他多智能體系統以及人類運用的洞察。
借助NVIDIA Nemotron開放模型和 GPU 加速庫,組織可以構建 AI 驅動的文檔智能系統,用于研究、金融服務、法律等領域工作流。
這些開放模型、數據集和訓練方法在MTEB、MMTEB和ViDoRe V3等排行榜上表現優異,這些榜單是評估多語言和多模態檢索模型的權威基準。團隊可以從中選擇適用于搜索和問答等任務的最佳模型。
文檔處理如何優化商業智能
文檔智能系統能夠從復雜的布局中提取意義,擴展到龐大的文件庫,并準確顯示答案的來源,這在高風險環境中非常有用。這些系統:
理解豐富的文檔內容,超越簡單的文本抓取,從圖表、表格、圖形和混合語言頁面中捕獲信息,并像人類處理文檔一樣識別其結構、關系和上下文內容。
處理大量動態數據,并行攝取和處理海量文檔,同時保持知識庫的持續更新。
精確定位用戶所需的內容,幫助 AI 智能體精確找出與查詢最相關的段落、表格或文字,從而提供精準和準確的響應。
通過提供對特定頁面或圖表的引用,展示答案背后的證據,使團隊能夠獲得透明度和可審計性,這在受監管的行業中尤為關鍵。
其結果是從靜態文檔檔案轉變為直接驅動商業智能、客戶體驗和運營工作流的動態知識系統。
工作中的文檔智能
基于 NVIDIA Nemotron RAG 模型、Nemotron Parse 和加速計算構建的智能文檔處理系統,已經在重塑各行業組織從文檔中獲取洞察的方式。
Justt:AI 原生的退款管理和爭議優化平臺
在金融服務領域,支付糾紛常常給商家帶來巨大的收入損失和運營復雜性,其主要原因是處理糾紛所需的證據以非結構化格式存在。交易日志、客戶溝通記錄和政策文件通常分散在各個系統中,難以實現規模化處理,從而導致糾紛處理過程緩慢、依賴手動操作且成本高昂。
Justt.ai 提供的 AI 驅動平臺能夠大規模自動化整個退款處理生命周期。該平臺直接連接支付服務提供商和商戶數據源,以獲取交易數據、客戶交互記錄和政策信息,然后自動收集符合卡網絡和發卡機構要求的特定爭議證據。
該平臺的 AI 驅動爭議優化功能由 Nemotron Parse 提供支持,運用預測分析來確定哪些退款應反對或者接受,以及如何優化每次回應以實現最大化的凈回收。像 HEI Hotels & Resorts 這樣的領先酒店運營商使用該平臺自動化處理其酒店的爭議,不僅維持良好的客戶關系,同時還成功地收回了收入。
通過結合以文檔為中心的智能與決策自動化,商家能夠收回因不當退款而損失的大部分收入,并有效減少人工審核的工作量。
了解 Justt 的退款管理工具如何自主處理財務數據來解決商戶糾紛。
Docusign:擴展協議智能
Docusign 是智能協議管理領域的全球領導者,每天為超過 180 萬客戶和逾 10 億用戶處理數百萬筆交易。
協議是每項業務的基礎,但其中包含的關鍵信息通常隱藏在文檔的多個頁面中。為了提取信息,Docusign 需要從像 PDF 這樣的復雜文檔中高精度地提取表格、文本和元數據,使得企業能夠更快地理解并應對義務、風險和機遇。
Docusign 正在評估 Nemotron Parse,以用于大規模深度合約理解。基于 NVIDIA GPU,該模型將先進的 AI 技術與版面布局檢測和 OCR 相結合。該系統能夠可靠地解析復雜表格,并重建包含關鍵信息的表格結構。這大幅減少了人工校正的需求,確保即使是極復雜的合同,也能以客戶所期望的速度和準確性完成處理。
在此基礎上,Docusign 將把協議存儲庫轉化為結構化數據,為合同搜索、分析以及 AI 驅動的工作流提供支持——將協議轉變為業務資產,幫助企業及其團隊提升透明度、降低風險并更快地做出決策。
Edison Scientific:大規模文獻研究
Edison Scientific 的 Kosmos AI Scientist 助力研究人員梳理復雜的科學領域,進行文獻綜述、發現關聯點并挖掘相關證據。
Edison 需要一種能從大量 PDF 文件中快速、準確提取結構化信息的方法,包括那些傳統信息解析方法常處理不當的公式、表格和圖形。
通過將 NVIDIA Nemotron Parse 模型集成至其 PaperQA 管道中,Edison 可以分解研究論文、為關鍵概念建立索引,并以具體文獻段落為依據給出結論,從而提高科研人員的效率和答案質量。這種方法將龐大的研究文獻庫轉變為一個可交互、可查詢的知識引擎,助力加快假設生成和文獻審閱。
Nemotron Parse 的高效率可實現大規模經濟高效的服務,使 Edison 的團隊能夠解鎖整個多模態管道。
借助 NVIDIA 技術設計智能文檔處理應用
強大且適用特定領域的文檔智能管道需要能夠處理數據提取、嵌入和重排名的技術,同時確保數據的安全性,并遵循相關法規。
提取:Nemotron 提取和 OCR 模型快速攝取多模式 PDF、文本、表格、圖形和圖像,將其轉換為結構化、機器可讀的內容,同時保留其布局和語義。
嵌入:Nemotron 嵌入模型將段落、實體和視覺元素轉化為適用于文檔檢索的向量表示,從而實現語義準確的搜索。
重排名:Nemotron 重排名模型對候選段落進行評估,以確保最相關的內容作為大語言模型(LLM) 的上下文,從而提高答案的準確性并減少幻覺。
解析:Nemotron Parse 模型解析文檔語義,以精確的空間定位和正確的閱讀流程提取文本和表格。克服布局的可變性,將非結構化的文檔轉化為可操作的數據,從而提高了 LLM 和代理式工作流的準確性。
這些功能打包為NVIDIA NIM和基礎模型,可在 NVIDIA GPU 上高效運行,使團隊能夠從概念驗證擴展到生產部署落地,同時將敏感數據保留在其選擇的云或數據中心環境中。
最有效的 AI 系統混合使用前沿模型和開源模型,例如 NVIDIA Nemotron,通過 LLM 路由器來分析每個任務,自動選擇最適合的模型。這種方法可以在保持強大性能的同時管理計算成本并提高效率。
開始使用 NVIDIA Nemotron
獲取分步實操指南,學習如何搭建具備 RAG 能力的文檔處理管道。探索 Nemotron RAG 如何賦能為各行業定制的專用智能體。
另外,還可以嘗試使用 Nemotron RAG 模型和 NVIDIA NeMo Retriever 開放庫 (現已上線GitHub和Hugging Face) 以及Hugging Face上的 Nemotron Parse。
加入開發者社區,共同基于NVIDIA Blueprint for Enterprise RAG進行構建,該藍圖受到十余家行業領先的AI 數據平臺提供商的認可,現已上線NVIDIA 官網、GitHub和NGC 目錄。
-
NVIDIA
+關注
關注
14文章
5592瀏覽量
109721 -
AI
+關注
關注
91文章
39763瀏覽量
301366 -
智能體
+關注
關注
1文章
476瀏覽量
11604
原文標題:Nemotron Labs:AI 智能體如何將文檔轉化為實時商業智能
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
使用NVIDIA Nemotron模型構建語音驅動RAG智能體
NVIDIA 推出 Nemotron 3 系列開放模型
NVIDIA推動面向數字與物理AI的開源模型發展
NVIDIA Nemotron如何助力企業構建專業AI智能體
使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025構建高性能AI應用
利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發
面向科學仿真的開放模型系列NVIDIA Apollo正式發布
歐洲借助NVIDIA Nemotron優化主權大語言模型
ServiceNow攜手NVIDIA構建150億參數超級助手
企業使用NVIDIA NeMo微服務構建AI智能體平臺
NVIDIA 推出開放推理 AI 模型系列,助力開發者和企業構建代理式 AI 平臺
利用NVIDIA Nemotron開放模型構建智能文檔處理系統
評論