NVIDIA Vera CPU 為大規模數據處理、AI 訓練和智能體式推理提供最高性能與能效
新聞摘要:
NVIDIA Vera CPU 較傳統 CPU 在效率上提升 2 倍,速度提升 50%。
與 NVIDIA 合作部署 Vera CPU 的客戶包括阿里巴巴、字節跳動、Meta、Oracle Cloud Infrastructure、CoreWeave、Lambda、Nebius 和 Nscale。
已采用 Vera CPU 的制造商合作伙伴包括戴爾科技、HPE、聯想和 Supermicro,以及華碩、Compal、Foxconn、技嘉、Pegatron、Quanta Cloud Technology (QCT)、Wistron 和 Wiwynn。
加利福尼亞州圣何塞 — GTC — 太平洋時間 2026 年 3 月 16 日— NVIDIA 今日發布 NVIDIA Vera CPU,這是全球首款專為代理式 AI 與強化學習時代打造的處理器,其效率是傳統機架級 CPU 的 2 倍,速度提升 50%。
隨著推理和代理式 AI 的發展,規模、性能和成本越來越取決于支撐模型的基礎設施,這些模型負責規劃任務、運行工具、與數據交互、運行代碼并驗證結果。
NVIDIA Vera CPU基于NVIDIA Grace? CPU的成功經驗打造而成,助力各行業、各種規模的組織都能構建 AI 工廠,大規模釋放代理式 AI 的潛力。憑借卓越的單線程性能和每核心帶寬,Vera 重新定義了 CPU。它能提供更高的 AI 吞吐量、響應速度和效率,從而支持大規模 AI 服務,例如編程助手以及面向消費者和企業的智能體應用。
與 NVIDIA 合作部署 Vera 的頭部超大規模企業包括阿里巴巴、CoreWeave、Meta 和 Oracle Cloud Infrastructur,以及戴爾科技、HPE、聯想和 Supermicro 等全球系統制造商。這一廣泛采用使 Vera 成為面向開發者、初創公司、公共和私營機構及企業最重視的 AI 工作負載的新型 CPU 標準,有助于讓更多人平等地使用 AI 并加速創新。
NVIDIA 創始人兼首席執行官黃仁勛表示:“AI 正邁向一個轉折點,Vera 應勢而來。隨著智能變得具有能動性——能夠推理并采取行動——重心就轉移到了編排這些工作的系統。CPU 不再只是支持模型,而是開始驅動模型。憑借突破性的性能與能效,Vera 助力 AI 系統實現更快的運算速度和更廣的擴展能力。”
為各類數據中心提供靈活配置
NVIDIA 發布了全新的 Vera CPU 機架,集成了 256 個液冷 Vera CPU,能夠持續支持超過 22,500 個并發的 CPU 環境,每個環境均可以全性能獨立運行。AI 工廠可在單個機架內快速部署并擴展至數萬個并發實例和智能體工具。
全新的 Vera 機架采用NVIDIA MGX?模塊化參考架構,并獲得了全球 80 家生態合作伙伴的支持。
作為NVIDIA Vera Rubin NVL72平臺的一部分,Vera CPU 還可通過 NVIDIA NVLink?-C2C 互連技術與 NVIDIA GPU 配對,提供高達 1.8 TB / s 的相干帶寬,是 PCIe Gen 6 帶寬的 7 倍,從而實現 CPU 與 GPU 之間的高速數據共享。此外,NVIDIA 還推出了新的參考設計:將 Vera 用作 NVIDIA HGX? Rubin NVL8 系統的主機 CPU,負責協調 GPU 加速工作負載的數據搬運和系統控制。
Vera 系統的合作伙伴正推出支持雙路和單路 CPU 服務器配置,非常適合強化學習、智能體式推理、數據處理、系統編排、存儲管理、云應用以及高性能計算等場景。
在所有配置中,Vera 系統均與NVIDIA ConnectX?SuperNIC 網卡和NVIDIA BlueField?-4DPU 集成,以實現加速網絡、存儲和安全性能,這些對代理式 AI 至關重要。這使客戶能夠針對其特定工作負載進行優化,同時在整個 NVIDIA 平臺上保持統一的軟件堆棧。
專為智能體擴展而設計
通過結合高性能、高能效的 CPU 核心、高帶寬內存子系統以及第二代 NVIDIA 可擴展一致性互連架構 (NVIDIA Scalable Coherency Fabric),Vera 能夠在代理式 AI 與強化學習常見的極端利用率環境下,實現更快速的智能體響應。
Vera 搭載 88 個由 NVIDIA 專門設計的 Olympus 核心,可為涉及編譯器、運行時引擎、分析流水線、智能體工具和編排服務的工作負載提供高性能支持。每個核心可通過 NVIDIA Spatial Multithreading 技術同時運行兩個任務,以提供一致且可預測的性能,非常適合需要同時處理多項作業的多租戶 AI 工廠。
為進一步提升能效,Vera 引入了 NVIDIA 第二代低功耗內存子系統,采用 LPDDR5X 內存,可提供高達 1.2 TB / s 的帶寬。與通用 CPU 相比,其帶寬提升了 2 倍,而功耗僅為其一半。
廣泛的生態系統支持
AI 原生軟件開發領域的創新企業 Cursor 正采用 NVIDIA Vera,以提升其 AI 編程智能體的性能。
Cursor 聯合創始人兼首席執行官 Michael Truell 表示:“我們很高興能使用 NVIDIA Vera CPU 來提升整體吞吐量和效率,從而為我們的客戶提供更快速、響應更靈敏的編程智能體體驗。”
領先的流數據與 AI 平臺 Redpanda 正在采用 Vera,以顯著提升系統性能。
Redpanda 創始人兼首席執行官 Alex Gallego 表示:“Redpanda 最近測試了運行 Apache Kafka 兼容工作負載的 NVIDIA Vera,發現其性能遠超我們此前測試過的其他系統,延遲最高可降低至原來約 18%。Vera 代表了 CPU 架構發展的新方向,每顆核心擁有更大內存和更低單核成本,使我們的客戶能夠將實時流媒體工作負載擴展到前所未有的規模,并解鎖全新的 AI 與智能體應用。”
計劃部署 Vera CPU 的國家級實驗室包括 Leibniz Supercomputing Centre、Los Alamos National Laboratory、National Energy Research Scientific Computing Center (隸屬于 Lawrence Berkeley National Laboratory) 和 Texas Advanced Computing Center (TACC)。
TACC 高性能計算總監 John Cazes 表示:“在 TACC,我們最近測試了 NVIDIA Vera CPU 平臺,準備在即將推出的 Horizon 系統中進行部署。在運行六個科學應用時,早期結果令人矚目。Vera 在單核性能和內存帶寬方面的表現,代表著科學計算邁出了一大步。我們期待在今年晚些時候,為 Horizon 的 CPU 用戶提供基于 Vera 的節點。”
計劃部署 Vera CPU 的領先云服務提供商包括阿里巴巴、字節跳動、Cloudflare、CoreWeave、Crusoe、Lambda、Nebius、Nscale、Oracle Cloud Infrastructure、Together.AI 和 Vultr。
采用 Vera CPU 的領先基礎設施提供商包括Aivres、ASRock Rack、華碩、Compal、思科、戴爾、Foxconn、技嘉、HPE、Hyve、Inventec、聯想、MiTAC、MSI、Pegatron、Quanta Cloud Technology (QCT)、Supermicro、Wistron 和 Wiwynn。
發售時間
NVIDIA Vera 已進入全面量產階段,并將于今年下半年通過合作伙伴正式發售。
-
處理器
+關注
關注
68文章
20279瀏覽量
252998 -
cpu
+關注
關注
68文章
11294瀏覽量
225342 -
NVIDIA
+關注
關注
14文章
5639瀏覽量
109881
原文標題:GTC2026 | NVIDIA 推出 Vera CPU,專為代理式 AI 打造
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
NVIDIA發布Vera Rubin DSX AI Factory參考設計
Linux系統性能優化與調試的思路?
高壓高速低邊驅動器SiLM27531MAC-AQ,以30V耐壓與5A強驅提升系統性能
NVIDIA推出NVQLink高速互連架構
RK3399:性能與能效的嵌入式先鋒,解鎖多場景應用潛力
Linux系統性能優化技巧
MT6816以高分辨率角度反饋賦能無刷電機FOC系統能效躍升
佐航BYQ3712PK變壓器能效等級測試儀:以精準測量賦能配電變壓器能效升級
傾佳電子:SiC碳化硅功率器件革新混合逆變儲能系統,引領能效革命
Blue Lion超級計算機將在NVIDIA Vera Rubin上運行
交流充電樁負載能效提升技術
正點原子Linux最小系統板RK3506B資料發布!超低功耗,滿載功耗低發熱小,實現性能與能效雙突破!
能效比和算力提升的衡量方法
NVIDIA推出Vera CPU以顯著提升系統性能與能效
評論