作為 NVIDIA NIM 微服務(wù),開(kāi)放式 Llama Nemotron 大語(yǔ)言模型和 Cosmos Nemotron 視覺(jué)語(yǔ)言模型可在任何加速系統(tǒng)上為 AI 智能體提供強(qiáng)效助力。
人工智能正在進(jìn)入一個(gè)全新的時(shí)代——代理式 AI。在這個(gè)時(shí)代,專業(yè)智能體團(tuán)隊(duì)可以幫助人們解決復(fù)雜的問(wèn)題并自動(dòng)執(zhí)行重復(fù)任務(wù)。
借助定制 AI 智能體,各行各業(yè)的企業(yè)可以構(gòu)建智能解決方案,從而獲得前所未有的生產(chǎn)力。這些先進(jìn)的 AI 智能體需要一個(gè)多樣化生成式 AI 模型系統(tǒng),并且這些模型要針對(duì)代理式 AI 功能和能力進(jìn)行優(yōu)化。這樣的復(fù)雜程度意味著企業(yè)對(duì)強(qiáng)大、高效的企業(yè)級(jí)模型產(chǎn)生了極大的需求。
為了給企業(yè)代理式 AI 奠定基礎(chǔ),NVIDIA 宣布推出開(kāi)放式大語(yǔ)言模型 (LLM) 的 Llama Nemotron 系列。該模型基于 Llama 構(gòu)建,可以幫助開(kāi)發(fā)者在一系列應(yīng)用中創(chuàng)建和部署 AI 智能體,包括客戶支持、欺詐檢測(cè)、產(chǎn)品供應(yīng)鏈和庫(kù)存管理優(yōu)化。
許多 AI 智能體不僅需要語(yǔ)言技能,還需要感知世界并采取適當(dāng)行動(dòng)的能力,以更有效地發(fā)揮其作用。
借助全新的NVIDIA Cosmos Nemotron視覺(jué)語(yǔ)言模型 (VLM) 以及面向視頻搜索和摘要的NVIDIA NIM微服務(wù),開(kāi)發(fā)者可以構(gòu)建智能體,分析來(lái)自自主機(jī)器、醫(yī)院、商店和倉(cāng)庫(kù)的圖像和視頻以及體育賽事、電影和新聞,并對(duì)其做出響應(yīng)。針對(duì)希望為機(jī)器人和自動(dòng)駕駛汽車領(lǐng)域生成物理感知視頻的開(kāi)發(fā)者,NVIDIA 還宣布推出 NVIDIA Cosmos世界基礎(chǔ)模型。
開(kāi)放式 Llama Nemotron 模型
優(yōu)化了 AI 智能體的計(jì)算效率和精度
NVIDIA Llama Nemotron模型基于 Llama 基礎(chǔ)模型而構(gòu)建,為 AI 智能體開(kāi)發(fā)提供經(jīng)過(guò)優(yōu)化的基礎(chǔ)模組。Llama 基礎(chǔ)模型是最熱門(mén)的商用開(kāi)源模型集合之一,下載次數(shù)超過(guò) 6.5 億次。這一成果建立在 NVIDIA 致力于開(kāi)發(fā)前沿模型的基礎(chǔ)之上,例如 Llama 3.1 Nemotron 70B,現(xiàn)在可通過(guò) NVIDIA API 目錄獲取。
Llama Nemotron 模型使用 NVIDIA 最新技術(shù)和高質(zhì)量數(shù)據(jù)集進(jìn)行剪枝和訓(xùn)練,可增強(qiáng)代理式 AI 功能。它們?cè)谥噶钭裱⒘奶臁⒑瘮?shù)調(diào)用、編碼和數(shù)學(xué)方面表現(xiàn)出色,同時(shí)經(jīng)過(guò)尺寸優(yōu)化,可在廣泛的 NVIDIA 加速計(jì)算資源上運(yùn)行。
Meta 副總裁兼 GenAI 負(fù)責(zé)人 Ahmad Al-Dahle 表示:“代理式 AI 是 AI 開(kāi)發(fā)的下一個(gè)前沿,為了抓住這次機(jī)會(huì),需要在 LLM 系統(tǒng)中進(jìn)行全棧優(yōu)化,以提供高效、準(zhǔn)確的 AI 智能體。通過(guò)與 NVIDIA 的合作,以及我們對(duì)開(kāi)放模型的共同承諾,基于 Llama 構(gòu)建的 NVIDIA Llama Nemotron 系列可以助力企業(yè)快速構(gòu)建自己的定制 AI 智能體。”
包括 SAP 和 ServiceNow 在內(nèi)的領(lǐng)先 AI 智能體平臺(tái)提供商,有望成為首批使用全新 Llama Nemotron 模型的企業(yè)。
SAP 首席人工智能官 Philipp Herzig 表示:“能夠跨多個(gè)業(yè)務(wù)線協(xié)作解決復(fù)雜任務(wù)的 AI 智能體將會(huì)超越當(dāng)今的生成式 AI 場(chǎng)景,將企業(yè)生產(chǎn)力提升到一個(gè)全新的水平。借助 SAP 的 Joule,數(shù)億企業(yè)用戶能夠與這些智能體進(jìn)行交互,以前所未有的速度實(shí)現(xiàn)他們的目標(biāo)。NVIDIA 的全新開(kāi)放式 Llama Nemotron 模型系列將推動(dòng)多個(gè)專用 AI 智能體的開(kāi)發(fā),助力業(yè)務(wù)流程轉(zhuǎn)型。”
ServiceNow 平臺(tái) AI 副總裁 Jeremy Barnes 表示:“AI 智能體使企業(yè)組織能夠事半功倍,為業(yè)務(wù)轉(zhuǎn)型樹(shù)立了新的標(biāo)準(zhǔn)。NVIDIA 開(kāi)放式 Llama Nemotron 模型性能和精度的提升有助于構(gòu)建先進(jìn)的 AI 智能體服務(wù),以解決各行業(yè)中各種職能的復(fù)雜問(wèn)題。”
NVIDIA Llama Nemotron 模型使用NVIDIA NeMo進(jìn)行蒸餾、剪枝和對(duì)齊。使用這些技術(shù)可以將這些模型保持較小的規(guī)模,以便在各種計(jì)算平臺(tái)上運(yùn)行,并在提供高精度的同時(shí)提高模型吞吐量。
Llama Nemotron 模型系列將以可下載模型和 NVIDIA NIM 微服務(wù)的形式提供,可輕松部署在云端、數(shù)據(jù)中心、PC 和工作站。它們可以為企業(yè)提供業(yè)界領(lǐng)先的性能,并且能夠可靠、安全且無(wú)縫地集成到其代理式 AI 應(yīng)用工作流中。
使用 NVIDIA NeMo 定制
并接入業(yè)務(wù)知識(shí)
Llama Nemotron 和 Cosmos Nemotron 模型系列將提供 Nano、Super 和 Ultra 三種規(guī)模,為部署各種規(guī)模的 AI 智能體提供廣泛選擇。
Nano:成本效益最高的模型,針對(duì)實(shí)時(shí)應(yīng)用進(jìn)行了優(yōu)化,延遲低,非常適合部署在 PC 和邊緣設(shè)備上。
Super:高精度模型,可在單個(gè) GPU 上提供卓越的吞吐量。
Ultra:精度最高的模型,專為需要超高性能的數(shù)據(jù)中心級(jí)應(yīng)用而設(shè)計(jì)。
企業(yè)還可以使用 NVIDIA NeMo 微服務(wù)為其特定用例和領(lǐng)域定制模型,以簡(jiǎn)化數(shù)據(jù)管護(hù)、加速模型定制和評(píng)估,還可以應(yīng)用護(hù)欄,以確保響應(yīng)正常。
借助NVIDIA NeMo Retriever,開(kāi)發(fā)者還可以集成檢索增強(qiáng)生成功能,將模型與企業(yè)數(shù)據(jù)連接起來(lái)。
使用面向代理式 AI 的NVIDIA Blueprint,企業(yè)可以利用 NVIDIA 先進(jìn)的 AI 工具和端到端開(kāi)發(fā)專長(zhǎng),快速構(gòu)建自己的應(yīng)用。事實(shí)上,NVIDIA Cosmos Nemotron、NVIDIA Llama Nemotron 和 NeMo Retriever 將為今天發(fā)布的面向視頻搜索和摘要的全新 NVIDIA Blueprint 提供強(qiáng)效助力。
NeMo、NeMo Retriever 和 NVIDIA Blueprint 均可通過(guò) NVIDIA AI Enterprise 軟件平臺(tái)使用。
可用性
Llama Nemotron 和 Cosmos Nemotron 模型將以托管應(yīng)用編程接口的形式提供,可通過(guò)NVIDIA 官網(wǎng)和 Hugging Face 下載。
NVIDIA 開(kāi)發(fā)者計(jì)劃的成員均可免費(fèi)訪問(wèn)開(kāi)發(fā)、測(cè)試和研究資源。
在生產(chǎn)中,企業(yè)可以使用 NVIDIA AI Enterprise 軟件平臺(tái)在加速數(shù)據(jù)中心和云計(jì)算基礎(chǔ)設(shè)施上運(yùn)行 Llama Nemotron 和 Cosmos Nemotron NIM 微服務(wù)。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5592瀏覽量
109720 -
人工智能
+關(guān)注
關(guān)注
1817文章
50094瀏覽量
265295 -
模型
+關(guān)注
關(guān)注
1文章
3751瀏覽量
52099
原文標(biāo)題:CES 2025 | NVIDIA 宣布推出 Nemotron 模型系列,推動(dòng)代理式 AI 發(fā)展
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
利用NVIDIA Nemotron開(kāi)放模型構(gòu)建智能文檔處理系統(tǒng)
韶音CES 2026新品發(fā)布:OpenFit Pro推出開(kāi)放式濾噪新方案
深入解析NVIDIA Nemotron 3系列開(kāi)放模型
NVIDIA 推出 Nemotron 3 系列開(kāi)放模型
NVIDIA推動(dòng)面向數(shù)字與物理AI的開(kāi)源模型發(fā)展
使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025構(gòu)建高性能AI應(yīng)用
利用NVIDIA Cosmos開(kāi)放世界基礎(chǔ)模型加速物理AI開(kāi)發(fā)
面向科學(xué)仿真的開(kāi)放模型系列NVIDIA Apollo正式發(fā)布
NVIDIA推出NVQLink高速互連架構(gòu)
NVIDIA Nemotron模型如何推動(dòng)AI發(fā)展
ServiceNow攜手NVIDIA構(gòu)建150億參數(shù)超級(jí)助手
企業(yè)使用NVIDIA NeMo微服務(wù)構(gòu)建AI智能體平臺(tái)
英偉達(dá)GTC2025亮點(diǎn) NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新
NVIDIA 推出開(kāi)放推理 AI 模型系列,助力開(kāi)發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)
NVIDIA推出開(kāi)放式Llama Nemotron系列模型
評(píng)論