開放式推理模型能夠更快、更廣泛地進行思考,為客戶服務、網(wǎng)絡安全、制造、物流和機器人等領域的 AI 智能體生成更明智的結果。
Capgemini 數(shù)據(jù)表明,截至 2028 年,AI 智能體將通過推動收入增長與節(jié)省成本創(chuàng)造高達 4,500 億美元的價值。構建這些智能體的開發(fā)者正轉向更高性能的推理模型,以改進 AI 智能體平臺和物理 AI 系統(tǒng)。
NVIDIA 在 SIGGRAPH 大會上宣布擴展兩個支持推理功能的系列模型:NVIDIA Nemotron和NVIDIA Cosmos,各行業(yè)的領導者都在使用這些模型,通過 AI 智能體和人形機器人編隊來提高生產(chǎn)力。
CrowdStrike、Uber、Magna、NetApp 和 Zoom 等一些企業(yè)都在使用這些系列模型。
全新 NVIDIA Nemotron Nano 2 和 Llama Nemotron Super 1.5 模型在同等規(guī)模模型中的科學推理、數(shù)學、編碼、工具調用、指令遵循和對話方面展現(xiàn)出優(yōu)異的精度表現(xiàn)。借助這些新模型,AI 智能體能夠提高思考深度和工作效率,從而探索更廣泛的選項、加速研究并在設定時限內(nèi)提供更明智的結果。
模型能被視為 AI 智能體的“大腦”,它提供了核心智能。但要使這類“大腦”在企業(yè)中發(fā)揮作用,必須將其嵌入到能理解特定工作流以及行業(yè)和業(yè)務術語,并能夠安全運行的智能體中。NVIDIA 可通過領先的庫和 AI 藍圖幫助企業(yè)大規(guī)模部署、定制和管理 AI 智能體,從而彌合這一差距。
Cosmos Reason是用于物理 AI 應用的新型推理視覺語言模型 (VLM),擅長了解現(xiàn)實世界的運作機制,使用結構化推理來理解物理學、客體永久性和時空對齊等概念。
Cosmos Reason 經(jīng)過量身定制,可作為機器人視覺語言動作 (VLA) 模型的推理主干,或為機器人和智能汽車訓練數(shù)據(jù)評論和注釋提供支持,并賦予運行時視覺 AI 智能體在工廠或城市等環(huán)境中對時空理解和物理操作的推理能力。
Nemotron:更大限度地提高
代理式企業(yè)級 AI 的精度和效率
隨著企業(yè)開發(fā) AI 智能體來處理復雜的多步驟任務,能夠通過高效生成 token 來提供超高推理準確性的模型將可實現(xiàn)大規(guī)模智能且自主的決策制定。
NVIDIA Nemotron 包含一系列先進的開放式推理模型,可使用領先的模型、NVIDIA 精選的開放數(shù)據(jù)集和先進 AI 技術,幫助 AI 智能體提高準確性和效率。
最新 Nemotron 模型在以下三個方面實現(xiàn)了出色的效率:全新混合模型架構、緊湊型量化模型以及可配置的思考預算,可幫助開發(fā)者控制 token 生成,從而將推理成本降低 60%。這種組合便于模型更深入地進行推理并更快響應,無需投入更多時間或算力。這意味著能夠以更低成本取得更好的結果。
與其他同等規(guī)模的領先模型相比,Nemotron Nano 2 將 token 生成提速 6 倍。
Llama Nemotron Super 1.5 在同類產(chǎn)品中實現(xiàn)了領先性能和極高的推理準確性,有助于 AI 智能體更高效地進行推理,做出更明智決策并獨立處理復雜任務。它現(xiàn)以 NVFP4(即 4 位浮點)格式提供,與 NVIDIA H100 GPU 相比,在 NVIDIA B200 GPU 上可將吞吐量提高 6 倍。

上圖顯示,在同一時段內(nèi)且計算預算相同的情況下,Nemotron 模型的推理實現(xiàn)了極高的準確性,并實現(xiàn)了單位成本下的極佳準確率。
在發(fā)布這兩個全新 Nemotron 模型的同時,NVIDIA 還宣布推出首個開放 VLM 訓練數(shù)據(jù)集 Llama Nemotron VLM 數(shù)據(jù)集 v1,該數(shù)據(jù)集包含 300 萬個光學字符識別、視覺 QA 和字幕數(shù)據(jù)樣本,可支持之前發(fā)布的 Llama 3.1 Nemotron Nano VL 8B 模型。
除推理模型精度以外,智能體還依賴檢索增強生成 (RAG) 技術,跨不同來源從聯(lián)網(wǎng)數(shù)據(jù)中獲取最新、最相關的信息,以便做出明智決策。最近發(fā)布的 Llama 3.2 NeMo Retriever 嵌入模型在三個視覺文檔檢索排行榜 (ViDoRe V1、ViDoRe V2 和 MTEB VisualDocumentRetrieval) 中均排名前列,可幫助提高智能體系統(tǒng)的準確性。
借助這些推理和信息檢索模型,使用AI-Q NVIDIA Blueprint構建的深度研究智能體目前在 DeepResearch Bench 上的開放可移植式智能體排行榜中排名首位。
NVIDIA NeMo和NVIDIA NIM可從開發(fā)、部署到智能體系統(tǒng)的監(jiān)管和優(yōu)化,支持整個 AI 智能體生命周期。
Cosmos Reason:物理 AI 領域的突破
VLM 標志著計算機視覺和機器人領域的突破,可助力機器識別物體和模式。但是,非推理的 VLM 缺乏理解現(xiàn)實世界并與之交互的能力,意味著它們既無法處理不確定性或新奇的情景,也無法執(zhí)行復雜的多步驟任務。
NVIDIA Cosmos Reason是一種專為物理 AI 和機器人而打造的全新開放式可定制 70 億參數(shù)推理 VLM。借助 Cosmos Reason,機器人和視覺 AI 智能體能夠像人類一樣進行推理,利用先驗知識、物理理解和常識來了解物理世界并采取行動。
Cosmos Reason 可為機器人和物理 AI 應用提供高級功能,例如訓練數(shù)據(jù)評論和字幕支持、機器人決策制定和視頻分析 AI 智能體。
它可以幫助自動處理并標注大型多樣化的訓練數(shù)據(jù)集,加速高精度 AI 模型的開發(fā)。它也可以充當用于機器人規(guī)劃的精密推理引擎,從而將復雜指令解析為即使在新環(huán)境也可供 VLA 模型執(zhí)行的步驟。
它還可為NVIDIA Metropolis平臺上基于視頻搜索和總結 (VSS) NVIDIA Blueprint 構建的視頻分析 AI 智能體提供支持,從大量存儲或實時的視頻數(shù)據(jù)中獲取寶貴見解。這些視覺感知和交互式 AI 智能體可以通過查明異常,來幫助工廠、倉庫、零售商店、機場、交叉路口等場所簡化操作。
NVIDIA 的機器人研究團隊將 Cosmos Reason 用于數(shù)據(jù)篩選和整理,并將其用作 VLA 模型(例如后續(xù)版本的NVIDIA Isaac GR00T NX)背后的 "System 2" 推理 VLM。
現(xiàn)已推出:適用于 AI 智能體和機器人的NVIDIA 推理模型無處不在
多元化企業(yè)和咨詢行業(yè)領導者都在采用 NVIDIA 的最新推理模型。從網(wǎng)絡安全到電信,各行業(yè)的領導者都開始使用 Nemotron 來構建企業(yè)級 AI 智能體。
Zoom計劃將 Nemotron 推理模型與 Zoom AI Companion 相結合,幫助做出決策并管理多步驟任務,以便 Zoom Meetings、Zoom Chat 和 Zoom 文檔用戶執(zhí)行操作。
CrowdStrike正在測試 Nemotron 模型,以便其 Charlotte AI 智能體在 CrowdStrike Falcon 平臺上寫入請求。
Amdocs正在其 amAIz 套件中使用 NVIDIA Nemotron 模型,以支持 AI 智能體處理護理、銷售、網(wǎng)絡和客戶支持等領域的復雜、多步驟自動化操作。
鑒于 Nemotron Nano 2 的高吞吐量,安永正采用該模型來支持大型企業(yè)組織中的代理式 AI,用于處理稅務、風險管理和金融用例。
NetApp正在測試 Nemotron 推理模型,以便 AI 智能體能夠搜索和分析業(yè)務數(shù)據(jù)。
DataRobot正在與 Nemotron 模型合作,用于其 Agent Workforce Platform,以實現(xiàn)端到端的智能體生命周期管理。
Tabnine正使用 Nemotron 模型,為開發(fā)者提供編碼任務建議和實現(xiàn)自動化編碼任務。
Automation Anywhere、CrewAI和Dataiku等代理式 AI軟件開發(fā)商都在其平臺中集成了 Nemotron 模型。
交通運輸、安全和 AI 智能領域的領先企業(yè)正使用 Cosmos Reason 來加強輔助駕駛、視頻分析、道路和工作場所的安全。
Uber正在探索如何使用 Cosmos Reason 來分析智能汽車的行為。此外,Uber 還在對 Cosmos Reason 進行后訓練,以總結視覺數(shù)據(jù)并分析行人穿行高速公路等場景,進而執(zhí)行質量分析并指導輔助駕駛行為。
Cosmos Reason 也可以作為智能汽車的“大腦”。它讓機器人能夠解讀環(huán)境,在接收到復雜指令時將其分解為任務,并使用常識去執(zhí)行任務,即便在陌生環(huán)境中也是如此。
Centific正在測試 Cosmos Reason,以增強其 AI 賦能的視頻智能平臺。運用 VLM,該平臺能夠將復雜的視頻數(shù)據(jù)處理為可供行動參考的見解,幫助減少誤報并提高決策制定的效率。
VAST正采用 NVIDIA Cosmos Reason 及其 AI 操作系統(tǒng)來大規(guī)模處理海量視頻流,推動實時城市智能發(fā)展。借助 VSS Blueprint,VAST 可構建能夠識別突發(fā)事件并觸發(fā)響應的智能體,將視頻流和元數(shù)據(jù)轉化為可操作的主動式公共安全工具。
Ambient.ai正使用 Cosmos Reason 的時間物理感知推理,自動檢測丟失的個人防護設備并監(jiān)測危險狀況,幫助改善建筑、制造、物流和其他工業(yè)環(huán)境中的環(huán)境健康與安全。
Magna正在將 Cosmos Reason 集成至其 City Delivery Platform(一個高度自主、低成本即時配送解決方案),幫助車輛更快地適應新城市。該模型為車輛的長期軌跡規(guī)劃增添了對世界的理解能力。
這些模型預計將以 NVIDIA NIM 的形式提供,以便安全可靠地部署到任意 NVIDIA 加速基礎設施上,更大限度地提高隱私性和控制力。這些模型計劃不久后通過 Amazon Bedrock 和 Amazon SageMaker AI (用于 Nemotron 模型),以及 Azure AI Foundry、Oracle Data Science Platform 和 Google Vertex AI 發(fā)布。
您可在 NVIDIA 官網(wǎng)上試用 Cosmos Reason,或通過 Hugging Face 和 GitHub 下載。
Nemotron Nano 2 和 Llama Nemotron Super 1.5 (NVFP4) 將在不久后開放下載。
-
NVIDIA
+關注
關注
14文章
5594瀏覽量
109744 -
AI
+關注
關注
91文章
39793瀏覽量
301431 -
模型
+關注
關注
1文章
3752瀏覽量
52111
原文標題:SIGGRAPH 2025 | 全球行業(yè)先驅利用NVIDIA Nemotron和Cosmos推理模型,為企業(yè)構建AI智能體
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
NVIDIA推出代理式AI藍圖與電信推理模型
阿里巴巴發(fā)布通義千問旗艦推理模型Qwen3-Max-Thinking
LLM推理模型是如何推理的?
NVIDIA推動面向數(shù)字與物理AI的開源模型發(fā)展
NVIDIA Nemotron如何助力企業(yè)構建專業(yè)AI智能體
什么是AI模型的推理能力
NVIDIA Nemotron Nano 2推理模型發(fā)布
澎峰科技完成OpenAI最新開源推理模型適配
基于NVIDIA Llama Nemotron Super v1.5模型構建AI智能體
信而泰×DeepSeek:AI推理引擎驅動網(wǎng)絡智能診斷邁向 “自愈”時代
企業(yè)使用NVIDIA NeMo微服務構建AI智能體平臺
詳解 LLM 推理模型的現(xiàn)狀
英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎模型和物理AI數(shù)據(jù)工具的重大更新
英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型
NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構建代理式 AI 平臺
利用NVIDIA推理模型構建AI智能體
評論