国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

利用NVIDIA推理模型構建AI智能體

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2025-08-13 14:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

開放式推理模型能夠更快、更廣泛地進行思考,為客戶服務、網(wǎng)絡安全、制造、物流和機器人等領域的 AI 智能體生成更明智的結果。

Capgemini 數(shù)據(jù)表明,截至 2028 年,AI 智能體將通過推動收入增長與節(jié)省成本創(chuàng)造高達 4,500 億美元的價值。構建這些智能體的開發(fā)者正轉向更高性能的推理模型,以改進 AI 智能體平臺和物理 AI 系統(tǒng)。

NVIDIA 在 SIGGRAPH 大會上宣布擴展兩個支持推理功能的系列模型:NVIDIA Nemotron和NVIDIA Cosmos,各行業(yè)的領導者都在使用這些模型,通過 AI 智能體和人形機器人編隊來提高生產(chǎn)力。

CrowdStrike、Uber、Magna、NetApp 和 Zoom 等一些企業(yè)都在使用這些系列模型。

全新 NVIDIA Nemotron Nano 2 和 Llama Nemotron Super 1.5 模型在同等規(guī)模模型中的科學推理、數(shù)學、編碼、工具調用、指令遵循和對話方面展現(xiàn)出優(yōu)異的精度表現(xiàn)。借助這些新模型,AI 智能體能夠提高思考深度和工作效率,從而探索更廣泛的選項、加速研究并在設定時限內(nèi)提供更明智的結果。

模型能被視為 AI 智能體的“大腦”,它提供了核心智能。但要使這類“大腦”在企業(yè)中發(fā)揮作用,必須將其嵌入到能理解特定工作流以及行業(yè)和業(yè)務術語,并能夠安全運行的智能體中。NVIDIA 可通過領先的庫和 AI 藍圖幫助企業(yè)大規(guī)模部署、定制和管理 AI 智能體,從而彌合這一差距。

Cosmos Reason是用于物理 AI 應用的新型推理視覺語言模型 (VLM),擅長了解現(xiàn)實世界的運作機制,使用結構化推理來理解物理學、客體永久性和時空對齊等概念。

Cosmos Reason 經(jīng)過量身定制,可作為機器人視覺語言動作 (VLA) 模型的推理主干,或為機器人和智能汽車訓練數(shù)據(jù)評論和注釋提供支持,并賦予運行時視覺 AI 智能體在工廠或城市等環(huán)境中對時空理解和物理操作的推理能力。

Nemotron:更大限度地提高

代理式企業(yè)級 AI 的精度和效率

隨著企業(yè)開發(fā) AI 智能體來處理復雜的多步驟任務,能夠通過高效生成 token 來提供超高推理準確性的模型將可實現(xiàn)大規(guī)模智能且自主的決策制定。

NVIDIA Nemotron 包含一系列先進的開放式推理模型,可使用領先的模型、NVIDIA 精選的開放數(shù)據(jù)集和先進 AI 技術,幫助 AI 智能體提高準確性和效率。

最新 Nemotron 模型在以下三個方面實現(xiàn)了出色的效率:全新混合模型架構、緊湊型量化模型以及可配置的思考預算,可幫助開發(fā)者控制 token 生成,從而將推理成本降低 60%。這種組合便于模型更深入地進行推理并更快響應,無需投入更多時間或算力。這意味著能夠以更低成本取得更好的結果。

與其他同等規(guī)模的領先模型相比,Nemotron Nano 2 將 token 生成提速 6 倍。

Llama Nemotron Super 1.5 在同類產(chǎn)品中實現(xiàn)了領先性能和極高的推理準確性,有助于 AI 智能體更高效地進行推理,做出更明智決策并獨立處理復雜任務。它現(xiàn)以 NVFP4(即 4 位浮點)格式提供,與 NVIDIA H100 GPU 相比,在 NVIDIA B200 GPU 上可將吞吐量提高 6 倍。

aaa7a49e-7751-11f0-a18e-92fbcf53809c.png

上圖顯示,在同一時段內(nèi)且計算預算相同的情況下,Nemotron 模型的推理實現(xiàn)了極高的準確性,并實現(xiàn)了單位成本下的極佳準確率。

在發(fā)布這兩個全新 Nemotron 模型的同時,NVIDIA 還宣布推出首個開放 VLM 訓練數(shù)據(jù)集 Llama Nemotron VLM 數(shù)據(jù)集 v1,該數(shù)據(jù)集包含 300 萬個光學字符識別、視覺 QA 和字幕數(shù)據(jù)樣本,可支持之前發(fā)布的 Llama 3.1 Nemotron Nano VL 8B 模型。

除推理模型精度以外,智能體還依賴檢索增強生成 (RAG) 技術,跨不同來源從聯(lián)網(wǎng)數(shù)據(jù)中獲取最新、最相關的信息,以便做出明智決策。最近發(fā)布的 Llama 3.2 NeMo Retriever 嵌入模型在三個視覺文檔檢索排行榜 (ViDoRe V1、ViDoRe V2 和 MTEB VisualDocumentRetrieval) 中均排名前列,可幫助提高智能體系統(tǒng)的準確性。

借助這些推理和信息檢索模型,使用AI-Q NVIDIA Blueprint構建的深度研究智能體目前在 DeepResearch Bench 上的開放可移植式智能體排行榜中排名首位。

NVIDIA NeMo和NVIDIA NIM可從開發(fā)、部署到智能體系統(tǒng)的監(jiān)管和優(yōu)化,支持整個 AI 智能體生命周期。

Cosmos Reason:物理 AI 領域的突破

VLM 標志著計算機視覺和機器人領域的突破,可助力機器識別物體和模式。但是,非推理的 VLM 缺乏理解現(xiàn)實世界并與之交互的能力,意味著它們既無法處理不確定性或新奇的情景,也無法執(zhí)行復雜的多步驟任務。

NVIDIA Cosmos Reason是一種專為物理 AI 和機器人而打造的全新開放式可定制 70 億參數(shù)推理 VLM。借助 Cosmos Reason,機器人和視覺 AI 智能體能夠像人類一樣進行推理,利用先驗知識、物理理解和常識來了解物理世界并采取行動。

Cosmos Reason 可為機器人和物理 AI 應用提供高級功能,例如訓練數(shù)據(jù)評論和字幕支持、機器人決策制定和視頻分析 AI 智能體。

它可以幫助自動處理并標注大型多樣化的訓練數(shù)據(jù)集,加速高精度 AI 模型的開發(fā)。它也可以充當用于機器人規(guī)劃的精密推理引擎,從而將復雜指令解析為即使在新環(huán)境也可供 VLA 模型執(zhí)行的步驟。

它還可為NVIDIA Metropolis平臺上基于視頻搜索和總結 (VSS) NVIDIA Blueprint 構建的視頻分析 AI 智能體提供支持,從大量存儲或實時的視頻數(shù)據(jù)中獲取寶貴見解。這些視覺感知和交互式 AI 智能體可以通過查明異常,來幫助工廠、倉庫、零售商店、機場、交叉路口等場所簡化操作。

NVIDIA 的機器人研究團隊將 Cosmos Reason 用于數(shù)據(jù)篩選和整理,并將其用作 VLA 模型(例如后續(xù)版本的NVIDIA Isaac GR00T NX)背后的 "System 2" 推理 VLM。

現(xiàn)已推出:適用于 AI 智能體和機器人的NVIDIA 推理模型無處不在

多元化企業(yè)和咨詢行業(yè)領導者都在采用 NVIDIA 的最新推理模型。從網(wǎng)絡安全到電信,各行業(yè)的領導者都開始使用 Nemotron 來構建企業(yè)級 AI 智能體。

Zoom計劃將 Nemotron 推理模型與 Zoom AI Companion 相結合,幫助做出決策并管理多步驟任務,以便 Zoom Meetings、Zoom Chat 和 Zoom 文檔用戶執(zhí)行操作。

CrowdStrike正在測試 Nemotron 模型,以便其 Charlotte AI 智能體在 CrowdStrike Falcon 平臺上寫入請求。

Amdocs正在其 amAIz 套件中使用 NVIDIA Nemotron 模型,以支持 AI 智能體處理護理、銷售、網(wǎng)絡和客戶支持等領域的復雜、多步驟自動化操作。

鑒于 Nemotron Nano 2 的高吞吐量,安永正采用該模型來支持大型企業(yè)組織中的代理式 AI,用于處理稅務、風險管理和金融用例。

NetApp正在測試 Nemotron 推理模型,以便 AI 智能體能夠搜索和分析業(yè)務數(shù)據(jù)。

DataRobot正在與 Nemotron 模型合作,用于其 Agent Workforce Platform,以實現(xiàn)端到端的智能體生命周期管理。

Tabnine正使用 Nemotron 模型,為開發(fā)者提供編碼任務建議和實現(xiàn)自動化編碼任務。

Automation Anywhere、CrewAI和Dataiku等代理式 AI軟件開發(fā)商都在其平臺中集成了 Nemotron 模型。

交通運輸、安全和 AI 智能領域的領先企業(yè)正使用 Cosmos Reason 來加強輔助駕駛、視頻分析、道路和工作場所的安全。

Uber正在探索如何使用 Cosmos Reason 來分析智能汽車的行為。此外,Uber 還在對 Cosmos Reason 進行后訓練,以總結視覺數(shù)據(jù)并分析行人穿行高速公路等場景,進而執(zhí)行質量分析并指導輔助駕駛行為。

Cosmos Reason 也可以作為智能汽車的“大腦”。它讓機器人能夠解讀環(huán)境,在接收到復雜指令時將其分解為任務,并使用常識去執(zhí)行任務,即便在陌生環(huán)境中也是如此。

Centific正在測試 Cosmos Reason,以增強其 AI 賦能的視頻智能平臺。運用 VLM,該平臺能夠將復雜的視頻數(shù)據(jù)處理為可供行動參考的見解,幫助減少誤報并提高決策制定的效率。

VAST正采用 NVIDIA Cosmos Reason 及其 AI 操作系統(tǒng)來大規(guī)模處理海量視頻流,推動實時城市智能發(fā)展。借助 VSS Blueprint,VAST 可構建能夠識別突發(fā)事件并觸發(fā)響應的智能體,將視頻流和元數(shù)據(jù)轉化為可操作的主動式公共安全工具。

Ambient.ai正使用 Cosmos Reason 的時間物理感知推理,自動檢測丟失的個人防護設備并監(jiān)測危險狀況,幫助改善建筑、制造、物流和其他工業(yè)環(huán)境中的環(huán)境健康與安全。

Magna正在將 Cosmos Reason 集成至其 City Delivery Platform(一個高度自主、低成本即時配送解決方案),幫助車輛更快地適應新城市。該模型為車輛的長期軌跡規(guī)劃增添了對世界的理解能力。

這些模型預計將以 NVIDIA NIM 的形式提供,以便安全可靠地部署到任意 NVIDIA 加速基礎設施上,更大限度地提高隱私性和控制力。這些模型計劃不久后通過 Amazon Bedrock 和 Amazon SageMaker AI (用于 Nemotron 模型),以及 Azure AI Foundry、Oracle Data Science Platform 和 Google Vertex AI 發(fā)布。

您可在 NVIDIA 官網(wǎng)上試用 Cosmos Reason,或通過 Hugging Face 和 GitHub 下載。

Nemotron Nano 2 和 Llama Nemotron Super 1.5 (NVFP4) 將在不久后開放下載。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109744
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301431
  • 模型
    +關注

    關注

    1

    文章

    3752

    瀏覽量

    52111

原文標題:SIGGRAPH 2025 | 全球行業(yè)先驅利用NVIDIA Nemotron和Cosmos推理模型,為企業(yè)構建AI智能體

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA推出代理式AI藍圖與電信推理模型

    借助全新開源大型電信模型NVIDIA Blueprint,電信運營商能夠利用自有數(shù)據(jù)訓練 AI 智能
    的頭像 發(fā)表于 03-06 17:37 ?1536次閱讀

    阿里巴巴發(fā)布通義千問旗艦推理模型Qwen3-Max-Thinking

    今天,我們正式發(fā)布千問旗艦推理模型Qwen3-Max-Thinking,創(chuàng)下數(shù)項權威評測全球新紀錄。
    的頭像 發(fā)表于 01-27 15:47 ?386次閱讀
    阿里巴巴發(fā)布通義千問旗艦<b class='flag-5'>推理模型</b>Qwen3-Max-Thinking

    LLM推理模型是如何推理的?

    這篇文章《(How)DoReasoningModelsReason?》對當前大型推理模型(LRM)進行了深刻的剖析,超越了表面的性能宣傳,直指其技術本質和核心局限。以下是基于原文的詳細技術原理、關鍵
    的頭像 發(fā)表于 01-19 15:33 ?493次閱讀
    LLM<b class='flag-5'>推理模型</b>是如何<b class='flag-5'>推理</b>的?

    NVIDIA推動面向數(shù)字與物理AI的開源模型發(fā)展

    NVIDIA 發(fā)布一系列涵蓋語音、安全與輔助駕駛領域的全新 AI 工具,其中包括面向移動出行領域的行業(yè)級開源視覺-語言-動作推理模型(Reasoning VLA) NVIDIA DRI
    的頭像 發(fā)表于 12-13 09:50 ?1339次閱讀

    NVIDIA Nemotron如何助力企業(yè)構建專業(yè)AI智能

    隨著代理式 AI 的日益普及,開源模型與工具日趨成熟,各行業(yè)企業(yè)都在思考:我們該構建怎樣的 AI 智能
    的頭像 發(fā)表于 12-13 09:14 ?809次閱讀

    什么是AI模型推理能力

    NVIDIA 的數(shù)據(jù)工廠團隊為 NVIDIA Cosmos Reason 等 AI 模型奠定了基礎,該模型近日在 Hugging Face
    的頭像 發(fā)表于 09-23 15:19 ?1278次閱讀

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?1789次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理模型</b>發(fā)布

    澎峰科技完成OpenAI最新開源推理模型適配

    澎峰科技現(xiàn)已完成 OpenAI 最新開源推理模型 gpt-oss-20b 在 DeepFusion 大模型機上的原生適配與優(yōu)化,用戶可一鍵啟用這顆“小而強悍”的新引擎,在本地享受企業(yè)級 A
    的頭像 發(fā)表于 08-14 11:34 ?1408次閱讀

    基于NVIDIA Llama Nemotron Super v1.5模型構建AI智能

    AI 智能體現(xiàn)在已經(jīng)能夠解決多步驟問題、編寫生產(chǎn)級代碼并在多個領域擔任通用助手。但要充分發(fā)揮其潛力,還需要在控制成本的前提下加入先進的邏輯推理模型
    的頭像 發(fā)表于 08-05 16:17 ?1407次閱讀
    基于<b class='flag-5'>NVIDIA</b> Llama Nemotron Super v1.5<b class='flag-5'>模型</b><b class='flag-5'>構建</b><b class='flag-5'>AI</b><b class='flag-5'>智能</b><b class='flag-5'>體</b>

    信而泰×DeepSeek:AI推理引擎驅動網(wǎng)絡智能診斷邁向 “自愈”時代

    模態(tài)的技術特性,DeepSeek正加速推動AI在金融、政務、科研及網(wǎng)絡智能化等關鍵領域的深度應用。 信而泰:AI推理引擎賦能網(wǎng)絡智能診斷新范
    發(fā)表于 07-16 15:29

    企業(yè)使用NVIDIA NeMo微服務構建AI智能平臺

    已發(fā)布的 NeMo 微服務可與合作伙伴平臺集成,作為創(chuàng)建 AI 智能構建模塊,使用商業(yè)智能與強大的邏輯
    的頭像 發(fā)表于 04-27 15:05 ?1288次閱讀

    詳解 LLM 推理模型的現(xiàn)狀

    領域的最新研究進展,特別是自DeepSeekR1發(fā)布后興起的推理時間計算擴展相關內(nèi)容。在LLM中實施和改進推理簡單來說,基于LLM的推理模型是一種旨在通過生成中間
    的頭像 發(fā)表于 04-03 12:09 ?1615次閱讀
    詳解 LLM <b class='flag-5'>推理模型</b>的現(xiàn)狀

    英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎模型和物理AI數(shù)據(jù)工具的重大更新

    推理模型,讓開發(fā)者以前所未有的方式控制世界生成。 NVIDIA 還推出了兩款由 NVIDIA Omniverse 和 Cosmos 平臺提供支持的新藍圖,為開發(fā)者提供用于機
    的頭像 發(fā)表于 03-20 19:01 ?1346次閱讀

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 發(fā)布了開源推理軟件 NVIDIA Dynamo,旨在以高效率、低成本加速并擴展 AI 工廠中的
    的頭像 發(fā)表于 03-20 15:03 ?1236次閱讀

    NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構建代理式 AI 平臺

    月 18 日 —— ?NVIDIA 今日發(fā)布具有推理功能的開源 Llama Nemotron 模型系列,旨在為開發(fā)者和企業(yè)提供業(yè)務就緒型基礎,助力構建能夠獨立工作或以團隊形式完成復雜
    發(fā)表于 03-19 09:31 ?390次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開放<b class='flag-5'>推理</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>系列,助力開發(fā)者和企業(yè)<b class='flag-5'>構建</b>代理式 <b class='flag-5'>AI</b> 平臺