新聞摘要:
全新 NVIDIA STX 參考架構可提升高達 5 倍的 Token 吞吐量,能效提升高達 4 倍,數據攝取速度提升 2 倍。
率先將 STX 用于上下文記憶存儲的廠商包括 CoreWeave、Crusoe、IREN、Lambda、Mistral AI、Nebius、Oracle Cloud Infrastructure(OCI)和 Vultr。
多家存儲廠商與制造合作伙伴正在基于 NVIDIA 模塊化參考設計來構建基礎設施,以推進代理式 AI 的發展,包括 AIC、Cloudian、DDN、戴爾科技、Everpure、Hitachi Vantara、HPE、IBM、MinIO、NetApp、Nutanix、Supermicro、Quanta Cloud Technology(QCT)、VAST Data 和 WEKA。
加利福尼亞州圣何塞 —— GTC —— 太平洋時間 2026 年 3 月 16 日 ——NVIDIA 今日宣布推出 NVIDIA BlueField-4? STX 模塊化參考架構,該架構可助力企業、云計算及 AI 服務商輕松部署加速存儲基礎設施,以滿足代理式 AI 所需的長上下文推理能力。
傳統數據中心提供大容量通用存儲,但難以滿足與跨多步驟、多工具和多輪會話的 AI 智能體無縫交互所需的響應速度。代理式 AI 需要實時訪問數據和上下文工作記憶,以確保對話和多任務的快捷性和連貫性。隨著上下文規模的不斷擴大,傳統存儲和數據路徑可能會降低 AI 推理的速度,并降低 GPU 利用率。
NVIDIA STX助力存儲廠商構建數據就近并可大規模訪問的基礎設施,從而使代理式 AI 工廠能夠在推理、訓練和分析方面提供更高的吞吐量和響應速度。
首個機架級部署方案集成了全新的NVIDIA CMX? 上下文記憶存儲平臺。通過引入高性能的上下文層來擴展 GPU 內存,從而實現可擴展的推理和代理式系統。與傳統存儲相比,每秒可處理的 Token 提升高達 5 倍。
NVIDIA 創始人兼首席執行官黃仁勛表示:“代理式 AI 正在重新定義軟件的能力,必須重塑其背后的計算基礎設施才能跟上這一步伐。能夠基于海量上下文進行推理并持續學習的 AI 系統,需要新的存儲方案。NVIDIA STX 重新定義了存儲堆棧,為 AI 原生基礎設施提供了模塊化基礎,確保 AI 工廠始終保持峰值性能高效運行?!?/p>
STX 由 NVIDIA Vera Rubin 平臺提供加速,集成了針對存儲進行優化的全新NVIDIA BlueField-4 處理器。該處理器將NVIDIA Vera CPU、NVIDIA ConnectX? -9 SuperNIC相結合,并配合NVIDIA Spectrum-X? 以太網網絡、NVIDIA DOCA?以及NVIDIA AI Enterprise軟件共同運行。
與傳統 CPU 架構相比,STX 架構的能效提升高達 4 倍,從而實現高性能存儲,并且在處理企業級 AI 數據時,每秒可處理的內存頁數提升 2 倍。
眾多存儲廠商合作伙伴正在基于 NVIDIA STX 共同設計新一代 AI 基礎架構,包括 Cloudian、DDN、戴爾科技、Everpure、Hitachi Vantara、HPE、IBM、MinIO、NetApp、Nutanix、VAST Data 和 WEKA。
正在構建基于 STX 系統的制造合作伙伴包括 AIC、Supermicro 和 Quanta Cloud Technology (QCT)。
計劃采用 STX 進行上下文記憶存儲的主要 AI 實驗室和云服務提供商包括 CoreWeave、Crusoe、IREN、Lambda、Mistral AI、Nebius、OCI 和 Vultr。
基于 STX 的平臺將于今年下半年由合作伙伴推出。
-
處理器
+關注
關注
68文章
20276瀏覽量
252981 -
NVIDIA
+關注
關注
14文章
5638瀏覽量
109879 -
存儲
+關注
關注
13文章
4812瀏覽量
90129
原文標題:GTC2026 | NVIDIA 推出 BlueField-4 STX 存儲架構,獲業界廣泛采用
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
Supermicro率先發布NVIDIA BlueField-4 STX存儲服務器,提升AI推理性能
NVIDIA BlueField-4為推理上下文記憶存儲平臺提供強大支持
NVIDIA BlueField-4數據處理器重塑新型AI原生存儲基礎設施
NVIDIA在CES 2026發布新一代Rubin AI平臺
NVIDIA在ISC 2025分享最新超級計算進展
NVIDIA推出NVQLink高速互連架構
NVIDIA推出全新BlueField-4 DPU
基于NVIDIA BlueField DPU的5G UPF數據面加速方案
NVIDIA DOCA 3.0版本的亮點解析
第三屆NVIDIA DPU黑客松開啟報名
NVIDIA推出NVLink Fusion技術
英偉達GTC2025亮點:NVIDIA認證計劃擴展至企業存儲領域,加速AI工廠部署
英偉達GTC2025亮點:NVIDIA與行業領先存儲企業共同推出面向AI時代的新型企業基礎設施
NVIDIA Blackwell數據手冊與NVIDIA Blackwell架構技術解析
NVIDIA 與行業領先的存儲企業共同推出面向 AI 時代的新型企業基礎設施
NVIDIA推出BlueField-4 STX存儲架構
評論