久久香蕉青草精品视频,色欲久久久久久,中文字幕在线观看一区二区

基于 NVIDIA Nemotron 開放模型的 AI 驅(qū)動文檔智能，增強科學(xué)研究、金融和法律等領(lǐng)域工作流。

智能文檔處理是一種由 AI 驅(qū)動的工作流，可以自動讀取、理解文檔并從中提取見解。它依托 AI 智能體和檢索增強生成 (RAG) 等技術(shù)，解析文檔中的多種格式（包括表格、圖編者注：本文是Nemotron Labs系列博客文章，探討最新的開放模型、數(shù)據(jù)集和訓(xùn)練技術(shù)如何幫助企業(yè)在 NVIDIA 平臺上構(gòu)建專用的 AI 系統(tǒng)和應(yīng)用。每篇文章都強調(diào)了在生產(chǎn)中使用開放堆棧來提供價值的實際方法，涵蓋了從透明的研究 copilot 到可擴展的 AI 智能體等領(lǐng)域。

如今，企業(yè)面臨著從各種文檔中 (包括報告、演示文稿、PDF、網(wǎng)頁和電子表格) 挖掘?qū)氋F見解的挑戰(zhàn)。

通常，團隊需要通過手動審閱文件、將數(shù)據(jù)復(fù)制到電子表格、構(gòu)建儀表板，以及使用基本的搜索或模板化的光學(xué)字符識別 (OCR) 工具來整理見解，而這些方法往往會遺漏復(fù)雜媒體中的重要細(xì)節(jié)。

智能文檔處理是一種由 AI 驅(qū)動的工作流，可以自動讀取、理解文檔并從中提取見解。它依托AI 智能體和檢索增強生成(RAG) 等技術(shù)，解析文檔中的多種格式 (包括表格、圖表、圖像和文本)，并將多模式內(nèi)容轉(zhuǎn)化為易于其他多智能體系統(tǒng)以及人類運用的洞察。

借助NVIDIA Nemotron開放模型和 GPU 加速庫，組織可以構(gòu)建 AI 驅(qū)動的文檔智能系統(tǒng)，用于研究、金融服務(wù)、法律等領(lǐng)域工作流。

這些開放模型、數(shù)據(jù)集和訓(xùn)練方法在MTEB、MMTEB和ViDoRe V3等排行榜上表現(xiàn)優(yōu)異，這些榜單是評估多語言和多模態(tài)檢索模型的權(quán)威基準(zhǔn)。團隊可以從中選擇適用于搜索和問答等任務(wù)的最佳模型。

文檔處理如何優(yōu)化商業(yè)智能

文檔智能系統(tǒng)能夠從復(fù)雜的布局中提取意義，擴展到龐大的文件庫，并準(zhǔn)確顯示答案的來源，這在高風(fēng)險環(huán)境中非常有用。這些系統(tǒng)：

理解豐富的文檔內(nèi)容，超越簡單的文本抓取，從圖表、表格、圖形和混合語言頁面中捕獲信息，并像人類處理文檔一樣識別其結(jié)構(gòu)、關(guān)系和上下文內(nèi)容。

處理大量動態(tài)數(shù)據(jù)，并行攝取和處理海量文檔，同時保持知識庫的持續(xù)更新。

精確定位用戶所需的內(nèi)容，幫助 AI 智能體精確找出與查詢最相關(guān)的段落、表格或文字，從而提供精準(zhǔn)和準(zhǔn)確的響應(yīng)。

通過提供對特定頁面或圖表的引用，展示答案背后的證據(jù)，使團隊能夠獲得透明度和可審計性，這在受監(jiān)管的行業(yè)中尤為關(guān)鍵。

其結(jié)果是從靜態(tài)文檔檔案轉(zhuǎn)變?yōu)橹苯域?qū)動商業(yè)智能、客戶體驗和運營工作流的動態(tài)知識系統(tǒng)。

工作中的文檔智能

基于 NVIDIA Nemotron RAG 模型、Nemotron Parse 和加速計算構(gòu)建的智能文檔處理系統(tǒng)，已經(jīng)在重塑各行業(yè)組織從文檔中獲取洞察的方式。

Justt：AI 原生的退款管理和爭議優(yōu)化平臺

在金融服務(wù)領(lǐng)域，支付糾紛常常給商家?guī)砭薮蟮氖杖霌p失和運營復(fù)雜性，其主要原因是處理糾紛所需的證據(jù)以非結(jié)構(gòu)化格式存在。交易日志、客戶溝通記錄和政策文件通常分散在各個系統(tǒng)中，難以實現(xiàn)規(guī)模化處理，從而導(dǎo)致糾紛處理過程緩慢、依賴手動操作且成本高昂。

Justt.ai 提供的 AI 驅(qū)動平臺能夠大規(guī)模自動化整個退款處理生命周期。該平臺直接連接支付服務(wù)提供商和商戶數(shù)據(jù)源，以獲取交易數(shù)據(jù)、客戶交互記錄和政策信息，然后自動收集符合卡網(wǎng)絡(luò)和發(fā)卡機構(gòu)要求的特定爭議證據(jù)。

該平臺的 AI 驅(qū)動爭議優(yōu)化功能由 Nemotron Parse 提供支持，運用預(yù)測分析來確定哪些退款應(yīng)反對或者接受，以及如何優(yōu)化每次回應(yīng)以實現(xiàn)最大化的凈回收。像 HEI Hotels & Resorts 這樣的領(lǐng)先酒店運營商使用該平臺自動化處理其酒店的爭議，不僅維持良好的客戶關(guān)系，同時還成功地收回了收入。

通過結(jié)合以文檔為中心的智能與決策自動化，商家能夠收回因不當(dāng)退款而損失的大部分收入，并有效減少人工審核的工作量。

了解 Justt 的退款管理工具如何自主處理財務(wù)數(shù)據(jù)來解決商戶糾紛。

Docusign：擴展協(xié)議智能

Docusign 是智能協(xié)議管理領(lǐng)域的全球領(lǐng)導(dǎo)者，每天為超過 180 萬客戶和逾 10 億用戶處理數(shù)百萬筆交易。

協(xié)議是每項業(yè)務(wù)的基礎(chǔ)，但其中包含的關(guān)鍵信息通常隱藏在文檔的多個頁面中。為了提取信息，Docusign 需要從像 PDF 這樣的復(fù)雜文檔中高精度地提取表格、文本和元數(shù)據(jù)，使得企業(yè)能夠更快地理解并應(yīng)對義務(wù)、風(fēng)險和機遇。

Docusign 正在評估 Nemotron Parse，以用于大規(guī)模深度合約理解。基于 NVIDIA GPU，該模型將先進的 AI 技術(shù)與版面布局檢測和 OCR 相結(jié)合。該系統(tǒng)能夠可靠地解析復(fù)雜表格，并重建包含關(guān)鍵信息的表格結(jié)構(gòu)。這大幅減少了人工校正的需求，確保即使是極復(fù)雜的合同，也能以客戶所期望的速度和準(zhǔn)確性完成處理。

在此基礎(chǔ)上，Docusign 將把協(xié)議存儲庫轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)，為合同搜索、分析以及 AI 驅(qū)動的工作流提供支持——將協(xié)議轉(zhuǎn)變?yōu)闃I(yè)務(wù)資產(chǎn)，幫助企業(yè)及其團隊提升透明度、降低風(fēng)險并更快地做出決策。

Edison Scientific：大規(guī)模文獻研究

Edison Scientific 的 Kosmos AI Scientist 助力研究人員梳理復(fù)雜的科學(xué)領(lǐng)域，進行文獻綜述、發(fā)現(xiàn)關(guān)聯(lián)點并挖掘相關(guān)證據(jù)。

Edison 需要一種能從大量 PDF 文件中快速、準(zhǔn)確提取結(jié)構(gòu)化信息的方法，包括那些傳統(tǒng)信息解析方法常處理不當(dāng)?shù)墓健⒈砀窈蛨D形。

通過將 NVIDIA Nemotron Parse 模型集成至其 PaperQA 管道中，Edison 可以分解研究論文、為關(guān)鍵概念建立索引，并以具體文獻段落為依據(jù)給出結(jié)論，從而提高科研人員的效率和答案質(zhì)量。這種方法將龐大的研究文獻庫轉(zhuǎn)變?yōu)橐粋€可交互、可查詢的知識引擎，助力加快假設(shè)生成和文獻審閱。

Nemotron Parse 的高效率可實現(xiàn)大規(guī)模經(jīng)濟高效的服務(wù)，使 Edison 的團隊能夠解鎖整個多模態(tài)管道。

借助 NVIDIA 技術(shù)設(shè)計智能文檔處理應(yīng)用

強大且適用特定領(lǐng)域的文檔智能管道需要能夠處理數(shù)據(jù)提取、嵌入和重排名的技術(shù)，同時確保數(shù)據(jù)的安全性，并遵循相關(guān)法規(guī)。

提取：Nemotron 提取和 OCR 模型快速攝取多模式 PDF、文本、表格、圖形和圖像，將其轉(zhuǎn)換為結(jié)構(gòu)化、機器可讀的內(nèi)容，同時保留其布局和語義。

嵌入：Nemotron 嵌入模型將段落、實體和視覺元素轉(zhuǎn)化為適用于文檔檢索的向量表示，從而實現(xiàn)語義準(zhǔn)確的搜索。

重排名：Nemotron 重排名模型對候選段落進行評估，以確保最相關(guān)的內(nèi)容作為大語言模型(LLM) 的上下文，從而提高答案的準(zhǔn)確性并減少幻覺。

解析：Nemotron Parse 模型解析文檔語義，以精確的空間定位和正確的閱讀流程提取文本和表格。克服布局的可變性，將非結(jié)構(gòu)化的文檔轉(zhuǎn)化為可操作的數(shù)據(jù)，從而提高了 LLM 和代理式工作流的準(zhǔn)確性。

這些功能打包為NVIDIA NIM和基礎(chǔ)模型，可在 NVIDIA GPU 上高效運行，使團隊能夠從概念驗證擴展到生產(chǎn)部署落地，同時將敏感數(shù)據(jù)保留在其選擇的云或數(shù)據(jù)中心環(huán)境中。

最有效的 AI 系統(tǒng)混合使用前沿模型和開源模型，例如 NVIDIA Nemotron，通過 LLM 路由器來分析每個任務(wù)，自動選擇最適合的模型。這種方法可以在保持強大性能的同時管理計算成本并提高效率。

開始使用 NVIDIA Nemotron

獲取分步實操指南，學(xué)習(xí)如何搭建具備 RAG 能力的文檔處理管道。探索 Nemotron RAG 如何賦能為各行業(yè)定制的專用智能體。

另外，還可以嘗試使用 Nemotron RAG 模型和 NVIDIA NeMo Retriever 開放庫 (現(xiàn)已上線GitHub和Hugging Face) 以及Hugging Face上的 Nemotron Parse。

加入開發(fā)者社區(qū)，共同基于NVIDIA Blueprint for Enterprise RAG進行構(gòu)建，該藍(lán)圖受到十余家行業(yè)領(lǐng)先的AI 數(shù)據(jù)平臺提供商的認(rèn)可，現(xiàn)已上線NVIDIA 官網(wǎng)、GitHub和NGC 目錄。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴