作者:Arm 云 AI 事業(yè)部服務器生態(tài)系統(tǒng)開發(fā)總監(jiān) Bhumik Patel
從推薦引擎到語言模型,人工智能 (AI) 正在重塑各類應用,但其背后潛藏著一項迫切的挑戰(zhàn):能效問題。隨著 AI 應用規(guī)模擴大,其運行所需的能耗也隨之增長,進而為云基礎(chǔ)設施帶來了日益嚴峻的壓力,尤其是在融合 AI 數(shù)據(jù)中心,傳統(tǒng)工作負載與 AI 工作負載已是并行運行。
在這一全新范式下,CPU 的重要性愈發(fā)凸顯。作為整個基礎(chǔ)設施的核心支柱,CPU 為絕大多數(shù)云服務提供算力支持,涵蓋數(shù)據(jù)處理、Web 前端、編排層及推理引擎等場景。現(xiàn)代 CPU 必須在處理日益增長的通用計算工作負載時,兼顧最優(yōu)性能、高能效表現(xiàn)與更低總體擁有成本 (TCO)。
這正是 Arm Neoverse 平臺的優(yōu)勢所在。Neoverse CPU 在架構(gòu)上專為云計算規(guī)模部署而設計,具備領(lǐng)先的每瓦性能、近乎線性的可擴展性,且無需專門優(yōu)化即可支持各類工作負載。
Google 與 Arm深化合作,更好滿足客戶需求
通過與 Arm 的合作,Google 打造了專為實際用例性能優(yōu)化的Axion 系列定制芯片 CPU。C4A 是 Google 首款基于 Arm Neoverse CPU 的虛擬機 (VM),其性能表現(xiàn)十分出色,輕松超越 x86 虛擬機。
稍早,Google 推出了第二款基于 Axion CPU 的 Arm 架構(gòu)虛擬機預覽版。N4A 基于 Neoverse 平臺構(gòu)建,是目前 Google Cloud 中最具成本效益的 N 系列虛擬機,為通用與 AI 相關(guān)工作負載(包括云應用、數(shù)據(jù)預處理及 Web 服務任務)提供業(yè)內(nèi)領(lǐng)先的性價比和每瓦性能。這一實例也充分體現(xiàn)了,在 Arm 計算平臺上優(yōu)化 CPU 設計,能直接轉(zhuǎn)化為可擴展、高能效且面向未來的云服務,例如 Google Kubernetes Engine (GKE) 與 Compute Engine。
根據(jù)早期測試顯示,與同類 x86 虛擬機相比,N4A 的性價比最高提升 105%,每瓦性能最高提升 80%,因此 N4A 非常適合注重能效的部署場景。這些性能提升并非理論值,Arm 針對 N4A 虛擬機的性能測試結(jié)果已予以驗證。

在 Redis(支撐快速內(nèi)存緩存與實時分析)和 PostgreSQL(支撐電子商務、金融服務和 Web 平臺的各類交易系統(tǒng))這兩項基礎(chǔ)云服務上,測試數(shù)據(jù)顯示,與當前一代 x86 N4 虛擬機相比,N4A 能分別帶來最高 52% 和 39% 的性能提升。
對開發(fā)者而言,Google Axion 的 N4A 虛擬機預覽版是運行真實場景工作負載,以及親身體驗新一代 Arm 架構(gòu)平臺性能的絕佳機會。
此外,Google 也推出了 C4A 裸機實例預覽版。這是 Google Cloud 上首款基于 Arm 架構(gòu)的裸機實例,專為需要直接訪問物理硬件的專用工作負載設計,例如汽車領(lǐng)域的車載信息娛樂系統(tǒng) (IVI) 或先進駕駛輔助系統(tǒng) (ADAS) 應用。對開發(fā)者而言,這意味著無論芯片部署在云端還是車端,都可運行同一套代碼,無需為不同類型的芯片重新編寫或重新優(yōu)化軟件。這最終將降低開發(fā)成本、縮短產(chǎn)品上市時間,并提升可在 Axion 芯片上運行的應用的可靠性。
這些基于 Neoverse 平臺的 Google Axion 機器類型,讓客戶能夠根據(jù)自身需求調(diào)整基礎(chǔ)設施規(guī)模,無需切換架構(gòu)或犧牲性能。這次的產(chǎn)品組合擴充也為優(yōu)化總體擁有成本 (TCO)、降低能源消耗,以及提升各種部署場景下工作負載響應速度提供了新的選擇。
Google 的多架構(gòu)發(fā)展趨勢:在 Arm 平臺上擴展關(guān)鍵工作負載
Google 正戰(zhàn)略性地將關(guān)鍵基礎(chǔ)設施工作負載遷移至 Arm 架構(gòu),重塑大規(guī)模服務的構(gòu)建和部署方式。如今,Gmail 和 YouTube 等 Google 主要應用已實現(xiàn) Arm 和 x86 架構(gòu)并行運行,并已有超過三萬個內(nèi)部應用遷移到基于 Arm 架構(gòu)的系統(tǒng)上。
值得注意的是,這一遷移無需進行大量的代碼重寫。得益于現(xiàn)代編譯器與構(gòu)建系統(tǒng),大多數(shù)架構(gòu)差異可在編譯階段自動處理,這充分體現(xiàn)了當今 Arm 軟件生態(tài)系統(tǒng)的成熟度和完善性,同時也意味著 Google 的團隊能夠?qū)⒏鄷r間投入到 DevOps 層優(yōu)化,以及更新測試、工作流和部署系統(tǒng),以支持具備多架構(gòu)感知的流水線。
對于任何考慮進行類似遷移的企業(yè)而言,遷移至 Arm 架構(gòu)基礎(chǔ)設施將獲得實用、高效且可直接投產(chǎn)的運行環(huán)境,以及完善的生態(tài)系統(tǒng)支持,使開發(fā)者能夠在不影響開發(fā)效率的前提下推進工作。
專為開發(fā)者和企業(yè)打造:成熟的生態(tài)系統(tǒng)與立竿見影的收益
在當前多架構(gòu)云環(huán)境中,靈活性具有戰(zhàn)略意義。通過基于 Arm 架構(gòu)構(gòu)建產(chǎn)品,Google 通過針對工作負載優(yōu)化過的芯片賦能其云計算客戶,使客戶能夠在廣泛的應用和云服務中針對性能、能效、成本和敏捷性進行調(diào)優(yōu)。
由于所有基于 Axion 的實例均運行在 Neoverse 平臺上,客戶可以直接使用 Arm 成熟的云原生軟件生態(tài)系統(tǒng),該生態(tài)系統(tǒng)支持現(xiàn)代容器編排、可觀測性、CI/CD 流水線和 AI/ML 框架等。結(jié)合 Google 的開發(fā)者工具,客戶能夠?qū)崿F(xiàn)更快的構(gòu)建速度、更智能的擴容和更優(yōu)的經(jīng)濟效益。
為進一步加速 Google Axion 平臺的落地應用,企業(yè)客戶可以參與 Arm 云遷移 (Arm Cloud Migration) 項目,獲取實操技術(shù)支持、遷移工具和最佳實踐。這些資源能幫助企業(yè)在云轉(zhuǎn)型過程中降低成本、提高性能,并實現(xiàn)更高的可持續(xù)發(fā)展目標。
-
ARM
+關(guān)注
關(guān)注
135文章
9552瀏覽量
391827 -
cpu
+關(guān)注
關(guān)注
68文章
11277瀏覽量
224938 -
AI
+關(guān)注
關(guān)注
91文章
39755瀏覽量
301354 -
開發(fā)者
+關(guān)注
關(guān)注
1文章
771瀏覽量
18008
原文標題:Arm 賦能新一代 Google Axion 實例,助力云端到車端全鏈路開發(fā)
文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
如何在Arm Neoverse N2平臺上提升llama.cpp擴展性能
中國中車全新一代6.X儲能平臺批量交付
Arm架構(gòu)助力Azure Cobalt 100虛擬機工作負載性能提升
Arm Lumex平臺賦能新一代旗艦智能手機體驗升級
Nordic新一代NRF54高性能藍牙, 賦能更多穿戴戒指行業(yè)客戶產(chǎn)品
Arm Neoverse平臺集成NVIDIA NVLink Fusion
新一代高效電機技術(shù)—PCB電機
Arm Neoverse N2平臺實現(xiàn)DeepSeek-R1滿血版部署
新品!米爾NXP i.MX 91核心板,賦能新一代入門級Linux應用
如何在基于Arm Neoverse平臺的Google Axion處理器上構(gòu)建RAG應用
解讀基于Arm Neoverse V2平臺的Google Axion處理器
Arm助力開發(fā)者加速遷移至Arm架構(gòu)云平臺 Arm云遷移資源分享
Arm Neoverse CMN S3 推動Compute Express Link (CXL) 存儲創(chuàng)新
如何在基于Arm Neoverse平臺的CPU上構(gòu)建分布式Kubernetes集群
Arm Neoverse平臺賦能新一代Google Axion實例
評論