国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA Dynamo新增對亞馬遜云科技服務的支持

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 2025-07-28 14:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

亞馬遜云科技 (AWS) 開發者和解決方案架構師現在可以在基于 NVIDIA GPU 的 Amazon EC2 上使用NVIDIA Dynamo,包括由 NVIDIA Blackwell 加速的 Amazon EC2 P6,并添加了對 Amazon Simple Storage (S3) 的支持,此外還有與 Amazon Elastic Kubernetes Services (EKS) 和 AWS Elastic Fabric Adapter (EFA) 的現有集成。此次更新將大規模部署大語言模型 (LLM) 的性能、可擴展性和成本效益提升到了新的水平。

NVIDIA Dynamo 擴展并服務于生成式 AI

NVIDIA Dynamo 是專為大規模分布式環境打造的開源推理服務框架。它支持所有主流推理框架,例如 PyTorch、SGLang、TensorRT-LLM 和 vLLM,并包含高級優化功能,例如:

分離服務:在不同的 GPU 上分離預填充和解碼推理階段,以提高吞吐量。

LLM 感知路由:通過路由請求,以更大限度地提高 KV 緩存命中率,并避免重復計算成本。

KV 緩存卸載:將 KV 緩存卸載至經濟高效的內存層級中,以降低推理成本。

這些功能使 NVIDIA Dynamo 能夠為大規模多節點的 LLM 部署提供出色的推理性能和成本效益。

與亞馬遜云科技服務無縫集成

對于在 AWS 云上部署 LLM 的 AWS 開發者和解決方案架構師,Dynamo 將無縫集成到您現有的推理架構中:

Amazon S3:Dynamo NIXL 現在支持 Amazon S3,這是一種對象存儲服務,可提供幾乎無限的可擴展性、高性能和低成本。

計算 KV 緩存需要大量資源且成本高昂。通常會重復使用緩存值而不是重新計算。但是,隨著 AI 工作負載的增長,重用所需的 KV 緩存量可能會迅速超過 GPU 甚至主機顯存。通過將 KV 緩存卸載到 S3,開發者可以釋放寶貴的 GPU 顯存來處理新請求。這種集成減輕了開發者構建自定義插件的負擔,使他們能夠將 KV 緩存無縫卸載到 S3,從而降低總體推理成本。

Amazon EKS:Dynamo 在 Amazon EKS 上運行,這是一種完全托管的 Kubernetes 服務,使開發者能夠運行和擴展容器化應用程序,而無需管理 Kubernetes 基礎設施。

隨著 LLM 的規模和復雜性不斷增加,生產環境中的推理部署現在需要高級組件,例如可感知 LLM 的請求路由、分離服務和 KV 緩存卸載。這些緊密集成的組件增加了在 Kubernetes 環境中部署的復雜性。借助這種支持,開發者可以將 Dynamo 無縫部署到由 EKS 管理的 Kubernetes 集群中,使他們能夠按需快速啟動新的 Dynamo 副本,以處理推理工作負載的突發增長。

3f3b9ffe-6878-11f0-a6aa-92fbcf53809c.jpg

圖 1:使用 Amazon EKS 的 AWS 部署架構上的 Dynamo

AWS Elastic Fabric Adapter (EFA):Dynamo 的 NIXL 數據傳輸庫支持 Amazon 的 EFA,這是一個在 Amazon EC2 實例之間提供低延遲節點間通信的網絡接口

隨著 LLM 規模的擴大并采用稀疏混合專家模型架構,跨多個 GPU 進行分片可在保持低延遲的同時提高吞吐量。在這些部署中,針對在 AWS 上運行的工作負載,使用 EFA 跨 GPU 節點傳輸推理數據。借助 Dynamo 的 EFA 支持,開發者可以通過 NIXL 的前端 API 使用簡單的 get、push 和 delete 命令,在節點之間輕松移動 KV 緩存。這樣一來,無需自定義插件即可訪問 Dynamo 的高級功能(如分離服務),加速 AI 應用的生產時間。

在 Blackwell 驅動的 Amazon P6 實例上

使用 Dynamo 優化推理

Dynamo 與任何 NVIDIA GPU 加速的亞馬遜云科技實例兼容,但與由 Blackwell 提供支持的 Amazon EC2 P6 實例搭配使用時,可顯著提升部署 DeepSeek R1 和最新 Llama 4 等高級邏輯推理模型時的性能。Dynamo 通過管理預填充和解碼自動縮放以及速率匹配等關鍵任務,簡化并自動處理分離 MoE 模型的復雜部署流程。

同時,Amazon P6-B200 實例具有第五代 Tensor Core、FP4 加速和 2 倍于上一代的 NVIDIA NVLink 帶寬,而由 NVIDIA提供支持的 P6e-GB200 Ultra 服務器具有獨特的擴展架構,可提供 130 TBps 的聚合全互聯帶寬,旨在加速混合專家模型 (MoE) 部署中廣泛采用的專家并行解碼操作所需的密集型通信模式。Dynamo 和 P6 驅動的 Blackwell 實例相結合,可提高 GPU 利用率,提高每美元的請求吞吐量,并推動生產級 AI 工作負載的利潤可持續增長。

開始使用 NVIDIA Dynamo

深化 Dynamo 與亞馬遜云科技的集成可幫助開發者無縫擴展其推理工作負載。

NVIDIA Dynamo 可在任何 NVIDIA GPU 加速的亞馬遜云科技實例上運行。部署 NVIDIA Dynamo,即刻開始優化推理堆棧:https://github.com/ai-dynamo/dynamo。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5592

    瀏覽量

    109721
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135431
  • 亞馬遜
    +關注

    關注

    8

    文章

    2731

    瀏覽量

    85738
  • kubernetes
    +關注

    關注

    0

    文章

    263

    瀏覽量

    9494

原文標題:NVIDIA Dynamo 新增對亞馬遜云科技服務的支持,可大規模提供經濟高效的推理

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Proteintech選擇亞馬遜科技為首選服務商,構建行業首個AI抗體助手加速科研創新

    商,基于亞馬遜科技的計算、容器、數據庫和分析等計算服務,僅歷時六個月成功構建業內首款AI抗體助手Able,可為全球科研人員提供精準、高效的產品信息與技術
    的頭像 發表于 01-05 11:14 ?418次閱讀

    亞馬遜科技擴展模型選擇 Amazon Bedrock新增18款開放權重模型

    亞馬遜科技在2025 re:Invent全球大會上宣布在Amazon Bedrock中新增18款開放權重模型,進一步強化其提供廣泛全托管模型選擇的承諾。Amazon Bedrock使客戶能夠
    的頭像 發表于 12-13 13:53 ?770次閱讀

    破局全球化IT挑戰:中宇聯以亞馬遜科技服務賦能制造行業數字化轉型

    +AI”服務平臺,為企業客戶提供從架構設計、遷移實施、智能運維到持續優化的端到端管理服務。近年來,中宇聯積極拓展與全球計算領袖
    的頭像 發表于 11-13 10:35 ?508次閱讀

    亞馬遜科技推出Amazon Quick Suite,引領Agentic AI驅動的工作新范式

    與內網)、主流應用(如Salesforce與Slack)、亞馬遜科技服務(如Amazon S3與Amazon Redshift)在內的多種數據源,并通過MCP集成接入超過
    的頭像 發表于 10-10 14:50 ?823次閱讀

    Dynamo 0.4在NVIDIA Blackwell上通過PD分離將性能提升4倍

    近期,OpenAI 的 gpt-oss、月之暗面的 Kimi K2 等多個新的前沿開源模型相繼問世,標志著大語言模型 (LLM) 創新浪潮的加速。近日發布的 Dynamo 0.4 提供了一系列新功能
    的頭像 發表于 08-22 15:59 ?1425次閱讀
    <b class='flag-5'>Dynamo</b> 0.4在<b class='flag-5'>NVIDIA</b> Blackwell上通過PD分離將性能提升4倍

    亞馬遜科技現已上線OpenAI開放權重模型

    客戶現可通過Amazon Bedrock和Amazon SageMaker AI使用OpenAI開放權重模型,實現將先進的開放權重模型與全球最廣泛服務的深度集成。 亞馬遜科技首次上
    的頭像 發表于 08-06 19:29 ?844次閱讀

    亞馬遜科技在2025紐約峰會發布多項AI agent創新

    七大核心服務,幫助企業大規模、安全部署與運行AI agents 亞馬遜科技Marketplace新增多項產品,助力企業發現、采購并部署領先的AI agents和工具 向
    的頭像 發表于 07-17 16:06 ?852次閱讀
    <b class='flag-5'>亞馬遜</b><b class='flag-5'>云</b>科技在2025紐約峰會發布多項AI agent創新

    2025 NVIDIA創業企業展示澳門站圓滿收官

    2025 技術精華解讀、亞馬遜科技 AI Agent 智能化應用分享、圓桌討論和項目路演、大企業對接、以及第三屆 NVIDIA DPU 中國黑客松競賽啟動等環節。本次活動由澳門永利渡假村、創賽創新中心聯合主辦,
    的頭像 發表于 05-29 14:12 ?931次閱讀

    亞馬遜科技與倫敦證券交易所集團擴展多年合作關系

    )業務部門的首選服務提供商。此次協議的簽署標志著雙方現有合作伙伴關系的進一步深化。 ? 通過將內部系統遷移至亞馬遜科技,倫敦證券交易所集團將進一步提升其運營的韌性和安全性,并在此基
    發表于 05-07 14:00 ?484次閱讀

    亞馬遜科技新增北京本地專用區域 與四維圖新深化合作賦能汽車智能化

    上海 ——2025 年 4 月 23 日 在2025亞馬遜科技汽車行業峰會期間,亞馬遜科技宣布,由光環新網運營的北京本地專用區域(Local Zones)正式可用,可以
    發表于 04-29 14:20 ?814次閱讀

    四維圖新亮相2025亞馬遜科技中國汽車行業峰會

    近日,在2025亞馬遜科技中國汽車行業峰會期間,亞馬遜科技宣布,由光環新網運營的北京本地專用區域(Local Zones)正式可用,可以支持
    的頭像 發表于 04-25 16:27 ?922次閱讀

    亞馬遜科技發布“3+2”合作伙伴戰略 與合作伙伴加速前行

    科技Marketplace和合作伙伴網絡系列支持計劃,持續賦能合作伙伴實現業務創新與規模化增長。同時,亞馬遜科技與德勤中國發布生成式AI勤智企業智能體工坊,賦能企業實現從概念到生成式AI應用的快速落地。
    發表于 04-25 14:43 ?1011次閱讀
    <b class='flag-5'>亞馬遜</b><b class='flag-5'>云</b>科技發布“3+2”合作伙伴戰略 與合作伙伴加速前行

    NVIDIA攜手谷歌助力企業引入代理式AI

    谷歌 Gemini 模型即將支持本地部署,可通過搭載 NVIDIA Blackwell 架構的基礎設施,在 Google 分布式上運行 NVIDIA 機密計算。
    的頭像 發表于 04-11 16:32 ?1206次閱讀

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    Triton 推理服務器的后續產品,NVIDIA Dynamo 是一款全新的 AI 推理服務軟件,旨在為部署推理 AI 模型的 AI 工廠最大化其 token 收益。它協調并加速數千
    的頭像 發表于 03-20 15:03 ?1231次閱讀

    Raksmart服務器如何支持AIGC創作

    為了支持AIGC創作的高效運行,高性能的服務器成為不可或缺的基礎設施。Raksmart作為一家領先的服務提供商,憑借其強大的計算能力、靈
    的頭像 發表于 03-12 11:32 ?709次閱讀