Nemotron 開源技術能夠幫助開發者與企業構建強大的通用和專用智能系統。
開放技術可供開發者與企業自由使用、修改和創新,貫穿了從互聯網誕生到云計算早期的每次重大技術變革。AI 也不該例外。
因此,NVIDIA Nemotron多模態 AI 模型、數據集和技術已向公眾全面開放。Nemotron 可用于本地個人電腦到企業級系統上的研究與商業用途,提供了一個開放的 AI 應用構建基礎平臺。開發者可通過 GitHub、Hugging Face 和 OpenRouter 使用。
通過 Nemotron,開發者、初創公司及各種規模的企業都能使用基于透明開源訓練數據訓練而成的模型。此外,Nemotron 還提供加速工具,覆蓋從定制到部署的全開發流程。
由于該技術的公開透明性,使用者能夠理解模型的運作機制并信任其輸出結果。
憑借其在通用智能與代理式 AI 推理方面的能力,以及對特定 AI 用例的適應性,Nemotron 如今已被制造、醫療、教育及零售等行業的 AI 創新者與領導者廣泛使用。
什么是 NVIDIA Nemotron?
NVIDIA Nemotron 是一套專為提高 AI 開發全流程效率而打造的開源 AI 技術集合,包含:
多模態模型:以開放檢查點形式交付的先進 AI 模型,在研究生級別科學推理、高等數學、編碼、指令執行、工具調用、視覺推理方面表現出色。
預訓練、后訓練及多模態數據集:精心篩選的文本、圖像和視頻數據集合,可用于訓練 AI 模型掌握語言、數學和問題解決等技能。
數值精度算法和方案:先進的精度技術,能在保障答案準確性的同時,大幅提升 AI 運行速度并降低成本。
用于高效擴展 GPU 集群上訓練規模的系統軟件:這是一系列經過優化的軟件與框架,可在 NVIDIA GPU 上實現大規模訓練與推理加速,適配超大模型的需求。
后訓練方法與軟件:提高 AI 智能水平、安全性和特定任務處理能力的微調步驟。
NVIDIA 致力于為開發者、行業領導者和公共及私營領域的 AI 基礎設施構建者提供開放、透明且自適應的 AI 平臺,而 Nemotron 正是該戰略的重要組成部分。
通用智能與專用智能有何區別?
NVIDIA 開發 Nemotron 是為了提升通用智能的能力(包括 AI 推理能力),同時加速專業化進程,進而幫助全球企業使用 AI 解決行業難題。
通用智能是指基于海量公開數據集訓練而成、可執行廣泛任務的模型,是解決各類問題和執行各類推理任務必不可少的引擎。專用智能學習某一行業或組織機構特有的語言、流程及優先事項,使 AI 模型能夠適應特定的現實應用。
要實現 AI 在各行業的規模化應用,兩者缺一不可。
因此,Nemotron 提供了針對多種計算平臺優化的預訓練基礎模型,以及NVIDIA NeMo和NVIDIA Dynamo等工具,以將通用 AI 模型轉化為定制化的專用智能模型。
開發者與企業如何使用 Nemotron?
NVIDIA 開發 Nemotron 的目標是加快全球開發者的工作進程,并且為未來 AI 系統設計指明方向。
無論是研究機構還是初創公司和跨國企業,開發者都需要靈活、可信的 AI。Nemotron 提供了構建、定制和集成 AI 的工具,適用于幾乎所有領域。
CrowdStrike正將面向安全團隊的 Charlotte AI AgentWorks 無代碼平臺與 Nemotron 集成,幫助推動代理式生態系統的發展并保護其安全。此次合作重新定義了安全運營模式,使分析師能夠大規模開發部署專用 AI 智能體,依托 Nemotron 模型打造可信賴的企業級安全防護體系。
DataRobot將 Nemotron 作為在其與 NVIDIA 合作開發的 Agent Workforce Platform 上大規模訓練、定制和管理 AI 智能體的開放基礎平臺。該解決方案可在本地、混合及多云環境中建立、運營和管理一支功能齊全的 AI 智能體團隊。
ServiceNow今年早些時候與 NVIDIA 合作推出了 Apriel Nemotron 15B 模型。該模型使用兩家公司的數據進行后訓練,專門用于執行實時工作流,并且能以更小規模提供先進的推理,使其更快、更高效并且兼具經濟效益。
倫敦大學學院主導的主權 AI 項目UK-LLM使用 Nemotron 開源技術和數據集開發了英語與威爾士語 AI 推理模型。
NVIDIA 還將從開發 Nemotron 獲得的洞察,應用于下一代系統設計,例如 Grace Blackwell、Vera Rubin 和 Feynman 等。AI 模型領域的最新創新成果例如精度縮減、稀疏運算、新型注意力機制、優化算法等正在重塑 GPU 架構。
例如,使用 Nemotron 開發的新數據格式 NVFP4 在大語言模型 (LLM) 訓練中每個參數僅用 4 位存儲。這項突破性進展大大降低了能耗,正在影響著未來 NVIDIA 系統架構的設計方向。
NVIDIA 還借助整個 AI 社區開發的開放技術優化 Nemotron。
阿里巴巴Qwen 開源模型提供的數據增強方案優化了 Nemotron 的預訓練與后訓練數據集。其最新 Qwen3-Next 架構突破了長上下文 AI 的技術邊界。該模型融合了 NVIDIA 研究中心與麻省理工學院共同開發的門控增量網絡 (Gated Delta Networks)。
作為 AI 推理領域的先驅,DeepSeek R1推動了 Nemotron 數學、代碼與推理開源數據集的開發,這些數據集可用于訓練模型掌握思考能力。
OpenAI的 gpt-oss 開源權重模型具有出色的推理、數學和工具調用能力,憑借其可調節的推理設置,可用于強化 Nemotron 后訓練數據集。
Llama-Nemotron 開放模型系列以Meta的 Llama 開放模型集合為基礎,并借助 Nemotron 數據集和方法獲得了先進的推理能力。
您可在 Hugging Face 上使用 NVIDIA Nemotron 模型與數據,來訓練和定制您自己的 AI 模型與智能體,或在 OpenRouter 上免費試用模型。使用 NVIDIA RTX PC 的開發者可通過 llama.cpp 框架獲取 Nemotron。
-
NVIDIA
+關注
關注
14文章
5592瀏覽量
109711 -
AI
+關注
關注
91文章
39754瀏覽量
301344 -
模型
+關注
關注
1文章
3751瀏覽量
52097
原文標題:公開的秘密:NVIDIA Nemotron 模型、數據集和技術如何推動 AI 發展
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
利用NVIDIA Nemotron開放模型構建智能文檔處理系統
NVIDIA在CES 2026發布全新開放模型、數據和工具
NVIDIA 推出 Nemotron 3 系列開放模型
NVIDIA推動面向數字與物理AI的開源模型發展
使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025構建高性能AI應用
利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發
歐洲借助NVIDIA Nemotron優化主權大語言模型
NVIDIA攜手微軟加速代理式AI發展
ServiceNow攜手NVIDIA構建150億參數超級助手
企業使用NVIDIA NeMo微服務構建AI智能體平臺
Cadence 利用 NVIDIA Grace Blackwell 加速AI驅動的工程設計和科學應用
NVIDIA 推出開放推理 AI 模型系列,助力開發者和企業構建代理式 AI 平臺
NVIDIA Nemotron模型如何推動AI發展
評論