
新聞摘要:
● Nemotron 3 系列開放模型包含 Nano、Super 和 Ultra 三種規模,具有極高的效率和領先的精度,適用于代理式 AI 應用開發。
● Nemotron 3 Nano 的吞吐量比 Nemotron 2 Nano 高 4 倍,并通過突破性的異構混合專家 (Hybrid Mixture-of-Experts) 架構,在大規模多智能體系統中實現了領先的每秒生成 token 數。
● Nemotron 通過先進的強化學習技術以及大規模并行多環境后訓練,實現了卓越的準確率。
● NVIDIA 率先推出整套前沿的開放模型、訓練數據集及強化學習環境與庫,助力構建高精度、高效的專業 AI 智能體。
NVIDIA 于 12 月 15 日宣布推出 NVIDIA Nemotron? 3 系列開放模型、數據和庫,為各個行業透明、高效的專業代理式 AI 開發提供助力。
Nemotron 3 模型提供 Nano、Super 和 Ultra 三種規模,采用突破性的異構潛在混合專家 (MoE) 架構,幫助開發者大規模開發并部署可靠的多智能體系統。
隨著企業從單模型對話機器人轉向協作式多智能體 AI 系統,開發者面臨著日益嚴峻的挑戰,包括通信開銷、上下文漂移和高推理成本等。此外,開發者需要模型具備透明度,才能信任其用于自動化復雜工作流。Nemotron 3 直面這些挑戰,為用戶提供開發專業化代理式 AI 所需的性能與開放性。
NVIDIA 創始人兼首席執行官黃仁勛表示:“開放創新是 AI 進步的基礎。通過 Nemotron,我們將先進 AI 轉化成開放平臺,為開發者提供構建大規模代理式系統所需的透明度與效率。”
NVIDIA Nemotron 為 NVIDIA 更廣泛的主權 AI 工作提供支持。從歐洲到韓國,企業組織紛紛采用開放、透明、高效的模型開發符合自身數據、法規與價值觀的 AI 系統。
Nemotron 系列模型的早期用戶包括埃森哲、Cadence、CrowdStrike、Cursor、德勤、安永、Oracle Cloud Infrastructure、Perplexity、ServiceNow、西門子、新思科技和 Zoom。他們正將 Nemotron 系列模型集成到制造、網絡安全、軟件開發、媒體、通信等行業的 AI 工作流中。
ServiceNow 董事長兼首席執行官 Bill McDermott 表示:“NVIDIA 與 ServiceNow 多年來一直致力于塑造 AI 的未來,而最好的部分尚未到來。今天,我們在幫助各行業領導者加速推進代理式 AI 戰略方面邁出了重要的一步。通過結合 ServiceNow 的智能工作流自動化與 NVIDIA Nemotron 3,我們將以出色的效率、速度與精度繼續定義行業標準。”
隨著多智能體 AI 系統的擴展,開發者越來越依賴專有模型來實現前沿推理,同時使用更加高效、可定制的開放模型降低成本。在單一工作流中于前沿級模型與 Nemotron 之間進行任務路由,既能賦予智能體強大的智能,同時還可以優化 token 經濟效益。
Perplexity 首席執行官 Aravind Srinivas 表示:“Perplexity 的構建理念是當精準 AI 融入先進工具時(例如 AI 助手),人類的好奇心將被放大。通過我們的智能體路由器,可以將工作負載定向到領先的精細調優開放模型,如 Nemotron 3 Ultra,或在任務能夠從其獨特能力中受益時,利用領先的專有模型,以此確保我們的 AI 助手能夠以卓越的速度、效率和規模運行?!?/p>
Nemotron 3 開放模型使初創公司能夠更快開發和迭代 AI 智能體,并加快從原型到企業級部署的創新進程。General Catalyst 和 Mayfield 旗下的投資組合公司正在探索如何使用 Nemotron 3 開發支持人機協作的 AI 隊友。
Mayfield 管理合伙人 Navin Chaddha 表示:“NVIDIA 的開放模型堆棧與 NVIDIA 初創加速計劃為初創公司提供了各類模型、工具及經濟高效的基礎設施,助力其開展試驗、實現差異化發展并快速擴展規模。Nemotron 3 可以讓創始人在構建代理式 AI 應用和 AI 隊友方面取得先機,并幫助他們利用 NVIDIA 龐大的用戶基礎。”
Nemotron 3 以高效和精準重塑多智能體 AI
Nemotron 3 系列 MoE 模型包含三種規模:
● Nemotron 3 Nano:是一款具備300 億參數的小型模型,每次運行最多激活 30 億參數,適用于針對性、高效的任務。
● Nemotron 3 Super:是一款具備約 1,000 億參數的高精度推理模型,每個 token最多激活 100 億參數,適用于多智能體應用。
● Nemotron 3 Ultra:是一款具備約 5,000 億參數的大型推理引擎,每個 token 最多激活 500 億參數,適用于復雜的 AI 應用。
Nemotron 3 Nano 已正式上線,是計算成本效益極高的模型,其針對軟件調試、內容摘要、AI 助手工作流及信息檢索等任務進行了優化,同時保持了較低的推理成本。該模型采用獨特的異構 MoE 架構,以實現效率與可擴展性的提升。
這一設計使其 token 吞吐量較 Nemotron 2 Nano 至高提升 4 倍,并減少了多達 60% 的推理 token 生成量,大大降低了推理成本。具備 100 萬 token 的上下文處理能力,Nemotron 3 Nano 具有更強的記憶能力,在處理長時間多步驟任務時能更精準地關聯信息。
獨立 AI 基準測試機構 Artificial Analysis 評定該模型為同等規模模型中兼具極高開放性和效率及卓越精度的模型。
在需要多智能體協作完成低延遲復雜任務的應用中,Nemotron 3 Super 表現出色。Nemotron 3 Ultra 則作為高級推理引擎,服務于需要深度研究和策略規劃的 AI 工作流。
Nemotron 3 Super 與 Ultra 采用基于 NVIDIA Blackwell 架構的超高效 4 位 NVFP4 訓練格式,可顯著降低顯存需求并加速訓練進程。這種效率使更大規模模型能在現有基礎設施上進行訓練,不會因更高精度格式而犧牲準確性。
借助 Nemotron 3 系列模型,開發者可根據特定工作負載選擇適配的開放模型,在數十至數百個智能體間靈活擴展,同時在復雜工作流中獲得更快速、精準的長時推理能力。
用于 AI 智能體定制的全新開放工具與數據
NVIDIA 還發布了面向專業 AI 智能體開發者的訓練數據集與前沿強化學習庫集合。
3 萬億 token 規模的全新 Nemotron 預訓練、后訓練及強化學習數據集,為開發高性能特定領域智能體提供了豐富的推理、編碼及多步驟工作流范例。Nemotron Agentic Safety Dataset 則提供真實場景的遙測數據,幫助團隊評估并提升復雜智能體系統的安全性。
為加速開發進程,NVIDIA 發布了 NeMo Gym 與NeMo RL 開源庫,為 Nemotron 模型提供訓練環境及后訓練基礎,同時還推出用于驗證模型安全性和性能的 NeMo Evaluator。所有工具及數據集現已上線 GitHub 和 Hugging Face 平臺。
Nemotron 3 已獲得 LM Studio 、llama.cpp、SGLang 和vLLM 支持。此外,Prime Intellect 與 Unsloth 正將 NeMo Gym 的即用型訓練環境直接集成至其工作流,使團隊能夠更加快速、便捷地獲得強大的強化學習訓練能力。
開始使用 NVIDIA 開放模型
Nemotron 3 Nano 現已上線 Hugging Face 平臺,并通過Baseten、Deepinfra、Fireworks、FriendliAI、OpenRouter、Together AI 等推理服務商提供。
Nemotron 還上線了多個企業級 AI 與數據基礎設施平臺,包括 Couchbase、DataRobot、H2O.ai、JFrog、Lambda 及 UiPath。此外,Nemotron 3 Nano 將通過 Amazon Bedrock(無服務器模式)在亞馬遜云科技 (AWS) 平臺上提供給使用公有云的客戶,并且也即將支持 Google Cloud、Coreweave、Crusoe、Microsoft Foundry、Nebius、Nscale 及 Yotta。
Nemotron 3 Nano 同時以 NVIDIA NIM 形式提供,可在 NVIDIA 加速基礎設施上進行安全、可擴展的部署,具有極高的隱私性與可控性。
Nemotron 3 Super 和 Ultra 預計將于 2026 年上半年推出。
關于 NVIDIA
-
NVIDIA
+關注
關注
14文章
5594瀏覽量
109723 -
AI
+關注
關注
91文章
39793瀏覽量
301382 -
模型
+關注
關注
1文章
3752瀏覽量
52102
發布評論請先 登錄
谷歌推出TranslateGemma全新開放翻譯模型系列
利用NVIDIA Nemotron開放模型構建智能文檔處理系統
NVIDIA在CES 2026發布全新開放模型、數據和工具
NVIDIA推動面向數字與物理AI的開源模型發展
使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025構建高性能AI應用
利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發
面向科學仿真的開放模型系列NVIDIA Apollo正式發布
歐洲借助NVIDIA Nemotron優化主權大語言模型
ServiceNow攜手NVIDIA構建150億參數超級助手
英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎模型和物理AI數據工具的重大更新
NVIDIA 推出開放推理 AI 模型系列,助力開發者和企業構建代理式 AI 平臺
NVIDIA 推出 Nemotron 3 系列開放模型
評論