隨著人工智能 (AI) 在數據中心、終端設備及各類中間場景中迅速普及,當前的核心挑戰已不再是打造智能計算本身,而是構建支撐其規模化應用所需的基礎設施。
AI 并非單一維度的問題,而是一個由全球領先的科技企業共同塑造的龐大生態系統。在這場價值數萬億美元級別的產業變革中,Arm 架構持續脫穎而出。
AI 數據中心:
由行業領袖企業定義,以 Arm 技術為基石
AI 領域的領軍企業,如 NVIDIA、亞馬遜云科技 (AWS)、微軟、Google、Oracle 和 OpenAI 正與 Arm 攜手,共同推動下一代數據中心的建設。據估計,為了滿足模型訓練、推理和具有成本效益的規模化擴展需求,AI 基礎設施領域的投資將突破萬億美元級別。
預計到 2025 年,出貨到頭部超大規模云服務提供商的算力中,將有近 50% 是基于 Arm 架構。目前,AWS (Graviton)、Google Cloud (Axion) 和 Microsoft Azure (Cobalt) 均已在其云基礎設施中部署了基于 Arm 架構的芯片,從而顯著節省能源和成本,并提升可擴展性。NVIDIA 的 Grace CPU 基于 Arm Neoverse 平臺構建,是 NVIDIA Grace Blackwell AI 超級芯片的核心組件;該超級芯片廣受市場青睞,僅全球前四大超大規模云服務提供商就已訂購 360 萬顆。事實上,目前已有超過 10 億顆基于 Arm Neoverse 平臺的 CPU 部署至數據中心,這一數據充分凸顯了 Arm 架構在全球數據中心建設中的核心地位。
在當今先進的 AI 數據中心技術棧中,Arm 架構作為普遍采用的基礎平臺,提供了傳統架構難以企及的可擴展性、效率和靈活性,其性價比和能效優勢包括:
與 x86 系統相比,NVIDIA 的 Grace-Hopper 超級芯片的模型訓練速度提升高達 8 倍,LLM 推理性能提升高達 4.5 倍[1]。
與 x86 相比,Google 的 Axion 推薦性能提升高達 3 倍[2],推理能力提升 2.5 倍,同時成本降低達 64%[3]。
截至 2024 年 12 月,AWS EC2 云服務的算力中,超過 50% 基于 AWS Graviton 所構建[4]。
此外,根據咨詢公司 Signal65 近期的分析報告顯示,基于 Arm Neoverse 平臺的 AWS Graviton4 芯片,不僅在性價比方面領先業界,更在企業級工作負載的整體性能上遠超 AMD 和英特爾推出的同類 x86 芯片。例如,Signal65 的基準測試結果表明,Graviton4 的大語言模型 (LLM) 推理性能比 AMD 同類產品高 168%,性價比高 220%;同時網絡吞吐量比英特爾同類產品高出 53%,機器學習 (ML) 訓練速度快于 34%。這些數據充分印證了 Arm 在 AI 和通用計算任務方面的顯著架構優勢。
從云端到邊緣側,AI 亟需新型計算平臺
AI 正在突破數據中心的邊界,向更廣闊的應用場景延伸。如今,無論是智能手機、個人電腦 (PC) 還是物聯網設備——小至低功耗傳感器,大到高性能工業應用——都需要端側生成式 AI 來重塑用戶體驗。
在此趨勢下,Arm 同樣獨具優勢。面向消費電子設備的全新Arm Lumex 計算子系統 (CSS) 平臺,可支持智能助手、語音翻譯和個性化服務等實時端側 AI 應用場景,而搭載 SME2 技術的全新 Arm CPU則可實現高達 5 倍的 AI 性能提升。同時,全球首個基于 Armv9 架構的邊緣 AI 計算平臺,專為物聯網應用中的邊緣 AI 工作負載優化,可支持參數規模超 10 億的端側 AI 模型運行。
Arm 正在驅動一場從云端到邊緣端的變革,憑借其本身的架構優勢賦能全場景的規模化部署。
軟件鑄就差異化優勢,Arm 工具為 AI 時代賦能
在 AI 領域,硬件構筑底層基礎,而軟件決定用戶體驗。隨著 AI 工作負載日益復雜、應用場景不斷拓展,開發者亟需一個能夠緊跟創新步伐的生態系統。而這正是 Arm 的優勢所在:一套統一的架構,搭配從云端到邊緣端、強大且經過優化的軟件生態系統。
多達 2,200 萬規模的 Arm 開發者群體將受益于這一協同生態系統,無論是數據中心的大規模模型訓練,還是邊緣側的實時推理,相同的代碼、工具與框架均可在不同設備上無縫運行。這種架構一致性顯著加速開發進程,簡化優化路徑,實現更廣泛的部署落地,避免冗余工程投入。
PyTorch ExecuTorch、TensorFlow Lite 和MediaPipe等主要框架,現已通過 Arm KleidiAI 與基于 Arm 架構的系統實現深度集成和優化。Arm KleidiAI 是輕量級的開源優化層,可激活基于 Arm 架構進行優化的底層微內核。如此一來,開發者無需修改代碼即可自動獲取性能增益——從超大規模云平臺到智能手機、嵌入式設備,全場景適用。
例如,在 Graviton4 上,KleidiAI 的集成使 Llama 3 的詞元 (token) 首次響應時間較基準提升了 2.5 倍;而在移動端,基于 MediaPipe 的方案在 Gemma 2B 等模型上,也實現了高達 30% 的性能提升。無論是管理 AI 工廠,還是在邊緣側部署聊天機器人,開發者均可獲得可預測、高性能和高能效的軟件體驗。
這種無縫、具備系統感知能力的軟件賦能方式,正是 Arm 平臺的核心差異化所在。開發者無需應對碎片化技術棧的困擾,也無需重復開展后端重構工作;相反,他們能夠直接借助這套軟硬件協同設計的生態系統,實現 AI 的性能和效率優勢。
在“每瓦性能”至關重要的 AI 時代,Arm 的軟件生態系統不僅緊跟行業需求,更能貼合開發者的實際場景,加速其創新進程。
AI 規模化發展的核心支柱
從萬億美元級的數據中心,到下一代智能手機與智能車載系統,AI 正在以前所未有的規模快速發展。作為貫通這些場景的橋梁,Arm 架構正發揮著關鍵作用。
憑借超大規模云服務提供商的廣泛部署、靈活的邊緣計算能力,以及充滿活力、AI 就緒的軟件生態系統,Arm 已成為當下和未來 AI 基礎設施的核心支柱。
-
ARM
+關注
關注
135文章
9552瀏覽量
391838 -
cpu
+關注
關注
68文章
11277瀏覽量
224948 -
AI
+關注
關注
91文章
39755瀏覽量
301358
原文標題:從云端到邊緣,Arm 為何是擴展 AI 技術棧的理想之選
文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
EFM32TG微控制器:低功耗高性能的理想之選
探索MAX9913:低功耗運放的理想之選
AMC1202:精準電流傳感的理想之選
AD8452:電池測試與形成系統的理想之選
RA0E2微控制器:低功耗設計的理想之選
TDK IBQ系列磁性片:RFID應用的理想之選
NXP S32M2xx系列MCU:汽車電機控制的理想之選
OPTIGA? Authenticate NBT開發板:物聯網安全認證的理想之選
KEMET MPGV金屬復合功率電感:汽車應用的理想之選
Amphenol RF 工業鍍技術:應對惡劣環境的理想之選
Amphenol “El Sharko” 3U VPX開發機箱:電子工程師的理想之選
Amphenol Millipacs? Plus可配置連接器:電子設計的理想之選
CONEC混合連接器:多領域應用的理想之選
AI應用創新與全棧技術融合分論壇即將召開
芯茂微 LP2179B:小家電電源的理想之選
Arm為何是擴展AI技術棧的理想之選
評論