伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA 推出 Dynamo 生產版本:廣泛采用的 AI 工廠推理操作系統(tǒng)

海闊天空的專欄 ? 來源:廠商供稿 ? 作者:廠商供稿 ? 2026-03-17 14:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

mmexport1773723774466.jpg

新聞摘要:

● NVIDIA Dynamo 1.0 為大規(guī)模分布式推理提供了生產級的開源基礎架構。

● Dynamo 和 NVIDIA TensorRT LLM 優(yōu)化已原生集成到 LangChain、llm-d、LMCache、SGLang 和 vLLM 等開源框架中,以提升推理性能。

● Dynamo 將 NVIDIA Blackwell GPU 推理性能至高提升 7 倍,并通過免費的開源軟件降低了 Token 成本,為數百萬 GPU 提供了增加收益的機會。

● NVIDIA 推理平臺已被云服務提供商亞馬遜云科技 (AWS)、微軟 Azure、谷歌云和 Oracle Cloud Infrastructure (OCI) 以及 NVIDIA 云合作伙伴阿里云、CoreWeave、Together AI 和 Nebius 所集成,并被 AI 原生公司 Cursor 和 Perplexity、推理端點提供商 Baseten、Deep Infra 和 Fireworks 以及字節(jié)跳動、美團、PayPal 和 Pinterest 等全球企業(yè)采用。

**加利福尼亞州圣何塞—— GTC —— 太平洋時間 2026 年 3 月 16 日 —— **NVIDIA 今日宣布,用于大規(guī)模生成式和智能體推理的開源軟件 NVIDIA Dynamo 1.0 現已在全球范圍內被廣泛采用。Dynamo 1.0 與 NVIDIA Blackwell 平臺相結合,助力云提供商、AI 創(chuàng)新者和全球企業(yè)能夠以無與倫比的規(guī)模、效率和速度提供高性能的 AI 推理服務。

隨著代理式 AI 系統(tǒng)在各行各業(yè)的應用,數據中心內的推理擴展已成為一項復雜的資源編排挑戰(zhàn),不同規(guī)模、不同模態(tài)的請求以及性能目標會以不可預測的突發(fā)形式出現。

正如計算機的操作系統(tǒng)協(xié)調硬件和應用程序一樣,Dynamo 1.0 作為 AI 工廠的分布式“操作系統(tǒng)”,在集群中無縫地協(xié)調 GPU 和顯存、內存等存儲資源,以驅動復雜的 AI 工作負載。在最近的行業(yè)基準測試中,Dynamo 將 NVIDIA Blackwell GPU 的推理性能至高提升 7 倍,并通過免費的開源軟件降低了 Token 成本,為數百萬 GPU 帶來了增加收益的機會。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“推理是智能的引擎,驅動了每一次查詢、每一個智能體以及每一個應用。通過 NVIDIA Dynamo,我們創(chuàng)建了首個面向 AI 工廠的‘操作系統(tǒng)’。整個生態(tài)系統(tǒng)中的快速采用表明新一波代理式 AI 浪潮已經到來,NVIDIA 正在全球范圍內推動其發(fā)展。”

Dynamo 1.0 通過引入更智能的“流量控制”以及在 GPU 和低成本存儲之間移動數據的能力,將推理工作分配到多個 GPU 上,從而減少了資源浪費并緩解了顯存限制。針對代理式 AI 和長提示,它可以將請求路由到已在稍早步驟獲得最相關“短期記憶”的 GPU,然后在無需使用時卸載該顯存。

NVIDIA 推理平臺發(fā)展勢頭強勁

通過將 NVIDIA Dynamo 和 NVIDIA TensorRT? LLM 庫優(yōu)化集成到 LangChain、llm-d、LMCache、SGLang、vLLM 等各大供應商的熱門框架中,NVIDIA 正在加速開源生態(tài)系統(tǒng)的發(fā)展。核心的 Dynamo 構建模塊,例如用于實現更智能 KV 存儲管理的 KVBM、用于實現快速 GPU 到 GPU 數據移動的 NVIDIA NIXL 以及用于簡化擴展的 NVIDIA Grove,也可作為獨立模塊使用。NVIDIA 還將 TensorRT LLM CUDA^?^ 內核貢獻給 FlashInfer 項目,以便將其原生集成到開源框架中。

NVIDIA 推理平臺在整個 AI 生態(tài)系統(tǒng)中得到支持,包括:

云服務提供商: 亞馬遜云科技 (AWS) 、微軟 Azure、谷歌云、OCI

NVIDIA 云合作伙伴: 阿里云、CoreWeave、Crusoe、DigitalOcean、Gcore、GMI Cloud、Lightning AI、Nebius、Nscale、Together AI、Vultr

AI 原生公司: Cursor、Hebbia、Perplexity

推理端點提供商: Baseten、Deep Infra、Fireworks

全球企業(yè): 阿斯利康、貝萊德、字節(jié)跳動、Coupang、Instacart、美團、PayPal、Pinterest、Shopee、軟銀集團

CoreWeave 產品和工程執(zhí)行副總裁 Chen Goldberg 表示:“隨著 AI 從實驗性試點轉向持續(xù)的大規(guī)模生產,底層基礎設施必須像其支持的模型一樣具備動態(tài)性。采用 NVIDIA Dynamo 使我們能夠為部署復雜的 AI 智能體提供更無縫、更具彈性的環(huán)境。這一底座具有穩(wěn)定性和高性能編排能力,助力業(yè)界具有挑戰(zhàn)性的智能體工作負載實現全球部署。”

Nebius 首席技術官 Danila Shtan 表示:“大規(guī)模交付可靠的 AI 推理不僅需要強大的 GPU,還需要將性能轉化為實際客戶價值的軟件。從 Dynamo 到 TensorRT LLM,我們高度重視 NVIDIA 的軟件堆棧,其帶來了深度優(yōu)化、可預測的性能以及更快的部署速度,幫助我們?yōu)榭蛻籼峁└唵巍⒏咝阅艿?AI 生產路徑。”

Pinterest 首席技術官 Matt Madrigal 表示:“為數億用戶提供直觀的多模態(tài) AI 體驗,需要全球規(guī)模的實時智能。作為開源領域的重要實踐者,我們致力于構建可擴展的 AI 技術。通過 NVIDIA Dynamo 對部署進行優(yōu)化,我們得以基于高性能 AI 基礎設施持續(xù)拓展,為用戶提供無縫、個性化體驗。”

Together AI 聯合創(chuàng)始人兼首席執(zhí)行官 Vipul Ved Prakash 表示:“AI 原生企業(yè)需要能夠可靠、高效地隨其應用規(guī)模而擴展的推理能力。NVIDIA Dynamo 1.0 與 Together AI 的前沿推理研究相結合,助力我們構建高性能堆棧,為大規(guī)模生產工作負載提供加速且經濟高效的推理。”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5616

    瀏覽量

    109864
  • 操作系統(tǒng)

    關注

    37

    文章

    7409

    瀏覽量

    129396
  • AI
    AI
    +關注

    關注

    91

    文章

    40074

    瀏覽量

    301713
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【免費直播】讓AI芯片擁有最強大腦—AI芯片的操作系統(tǒng)設計介紹.

    智慧化進程。人工智能芯片是人工智能發(fā)展的基石,是數據、算法和算力在各類場景應用落地的基礎依托。“無芯片不AI”已經深入人心,成為業(yè)界共識。本次直播將述說AI芯片設計帶你解析AI算法及其芯片操作
    發(fā)表于 11-07 14:18

    NVIDIA 在首個AI推理基準測試中大放異彩

    NVIDIA與合作伙伴和客戶一同向用戶全面地展示了NVIDIA產品組合的潛力。 全新的視角與產品推理指的是在實時生產系統(tǒng)中,通過運行
    發(fā)表于 11-08 19:44

    深度剖析OpenHarmony AI調度管理與推理接口

    的原因,原因包括:申請的內存等,線索的線索,回收。約束語言限制:C/C++語言操作系統(tǒng)限制:OpenHarmony 操作系統(tǒng)使用實例化類AiInference。調用的成員函數的推理路徑,在網絡模型中創(chuàng)建
    發(fā)表于 03-25 11:15

    蘋果正式推出全新操作系統(tǒng)的子版本iOS 14.2

    繼上周推出GM版后,蘋果今(6日)凌晨起,開始正式推送iOS 14.2、iPadOS 14.2,作為旗下行動裝置最新操作系統(tǒng)的子版本
    的頭像 發(fā)表于 11-06 14:16 ?2965次閱讀

    NVIDIA宣布其AI推理平臺的重大更新

    軟件的新功能,該軟件為所有AI模型和框架提供跨平臺推理;同時也包含對NVIDIA TensorRT的更新,該軟件優(yōu)化AI模型并為NVIDIA
    的頭像 發(fā)表于 11-12 14:42 ?2831次閱讀

    VIDAA發(fā)展速度領先的智能電視操作系統(tǒng)平臺推出最新版本

    作為一家專為本地市場量身打造智能聯網電視操作系統(tǒng)的領先供應商,VIDAA宣布推出其創(chuàng)新平臺的最新版本。新版本讓各品牌和廠商能夠獲得通常僅應用于高端品牌的最先進技術。新
    的頭像 發(fā)表于 04-15 19:04 ?3284次閱讀

    英偉達推出AI模型推理服務NVIDIA NIM

    英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型部署過程,為全球的2800萬英偉達開發(fā)者
    的頭像 發(fā)表于 06-04 09:15 ?1438次閱讀

    英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理
    的頭像 發(fā)表于 07-25 09:48 ?1488次閱讀

    銀河麒麟發(fā)布AIPC版本,填補操作系統(tǒng)推理能力研發(fā)缺口

    近日,在2024中國操作系統(tǒng)產業(yè)大會上,國產桌面操作系統(tǒng)銀河麒麟正式推出首個AIPC版。而這也是一款貼合人工智能的國產桌面操作系統(tǒng),成功彌補了我國在此項技術研發(fā)上的缺口。   作
    的頭像 發(fā)表于 08-09 15:55 ?1486次閱讀

    潤和軟件推出首個AI原生操作系統(tǒng)HopeOS V24

    近日,操作系統(tǒng)大會&openEuler Summit 2024在北京隆重舉辦。江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)于會上重磅發(fā)布基于openEuler 24.03 LTS版本的商業(yè)發(fā)行版——潤和企業(yè)級操作系統(tǒng)(服務器
    的頭像 發(fā)表于 11-17 09:16 ?2167次閱讀

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數百萬美元。
    的頭像 發(fā)表于 02-08 09:59 ?1735次閱讀
    使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b>平臺提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 發(fā)布了開源推理軟件 NVIDIA Dynamo,旨在以高效率、低成本加速并擴展
    的頭像 發(fā)表于 03-20 15:03 ?1322次閱讀

    NVIDIA驅動的AI工廠正在重新定義數據中心

    NVIDIA 及其生態(tài)系統(tǒng)合作伙伴正在為 AI 推理時代構建大規(guī)模 AI 工廠,而每家企業(yè)都將需
    的頭像 發(fā)表于 04-11 11:27 ?1031次閱讀
    <b class='flag-5'>NVIDIA</b>驅動的<b class='flag-5'>AI</b><b class='flag-5'>工廠</b>正在重新定義數據中心

    樹莓派操作系統(tǒng)版本、特性及設置完整指南!

    樹莓派操作系統(tǒng)是什么?樹莓派操作系統(tǒng)是由樹莓派基金會專為樹莓派開發(fā)的官方操作系統(tǒng)。它基于DebianLinux發(fā)行版,并針對樹莓派的ARM架構進行了專門優(yōu)化。樹莓派操作系統(tǒng)有多個
    的頭像 發(fā)表于 07-28 18:26 ?1496次閱讀
    樹莓派<b class='flag-5'>操作系統(tǒng)</b>:<b class='flag-5'>版本</b>、特性及設置完整指南!

    Commotion推出NVIDIA Nemotron?開源模型驅動的企業(yè)級AI操作系統(tǒng),助力數字員工團隊提升生產

    投資的領先AI原生初創(chuàng)企業(yè)Commotion Inc.今日宣布,推出一款與NVIDIA合作構建的全新AI操作系統(tǒng)
    的頭像 發(fā)表于 02-25 21:17 ?131次閱讀
    Commotion<b class='flag-5'>推出</b>由<b class='flag-5'>NVIDIA</b> Nemotron?開源模型驅動的企業(yè)級<b class='flag-5'>AI</b><b class='flag-5'>操作系統(tǒng)</b>,助力數字員工團隊提升<b class='flag-5'>生產</b>力