新聞重點
Arm Lumex CSS 平臺支持實時端側 AI 用例,覆蓋智能助手、語音翻譯及個性化服務;依托搭載全新 SME2 技術的 Arm CPU,該平臺可實現高達五倍的 AI 性能提升。
開發者可借助 KleidiAI 調用 SME2 技術帶來的性能優勢;目前 KleidiAI 已集成至所有主流移動操作系統及 AI 框架中,包括 PyTorch ExecuTorch、谷歌 LiteRT、阿里巴巴 MNN 及微軟 ONNX Runtime。
針對旗艦級設備,Arm Lumex CSS 平臺創造了前所未有的成就——連續六年締造兩位數的 IPC 性能提升。
全新 Arm Mali G1-Ultra 專為游戲玩家設計,可帶來兩倍的光線追蹤性能提升,重新定義移動娛樂體驗。
Arm 控股有限公司(納斯達克股票代碼:ARM,以下簡稱 Arm)今日宣布推出全新 Arm Lumex 計算子系統 (Compute Subsystem, CSS) 平臺,這是一套專為旗艦級智能手機及下一代個人電腦加速其人工智能 (AI) 體驗的先進計算平臺。Lumex CSS 平臺集成了搭載第二代可伸縮矩陣擴展 (SME2) 技術的最高性能 Arm CPU、GPU 及系統 IP,不僅能助力生態伙伴更快將 AI 設備推向市場,還可支持桌面級移動游戲、實時翻譯、智能助手及個性化應用等多樣的豐富體驗。
Arm 高級副總裁兼終端事業部總經理 Chris Bergey 表示:“AI 已不再僅僅是一項技術功能,它已成為下一代移動與消費技術的支撐底座。依托 Arm Lumex 平臺,我們持續提升端側 AI 體驗,以滿足用戶日益增長的需求與期待。為此,我們正積極將 SME2 技術擴展至每一個 CPU 平臺。預計到 2030 年,SME 與 SME2 技術將為超過 30 億臺設備新增超 100 億TOPS 的計算能力,為端側 AI 性能帶來指數級躍升。”
合作伙伴可靈活選擇使用 Arm Lumex 的方式,為其打造系統級芯片 (SoC)。例如,他們可直接采用 Arm 交付的平臺,并借助為其需求定制的先進物理實現方案,從而獲得縮短產品上市時間和快速兌現性能價值等雙重優勢;或者,合作伙伴也可根據他們的目標市場,對平臺寄存器傳輸級 (RTL) 設計進行配置,并自行完成核心模塊的硬化工作。
全新 Arm Lumex 平臺包含以下核心組件:
新一代搭載 SME2 技術的 Armv9.3 CPU 集群:包括 Arm C1-Ultra 和 Arm C1-Pro,為旗艦設備提供支持;
Arm C1-Premium:專為次旗艦市場打造,可提供一流的面積效率;
Arm Mali G1-Ultra GPU:配備新一代光線追蹤技術,在實現先進的圖形和游戲體驗同時,還可提升整體 AI 性能;
Arm C1-DSU:Arm 迄今為止最靈活、高能效且具多種電源模式的 DynamIQ Shared Unit (DSU);
針對 3 納米工藝節點優化的物理實現;
跨軟件棧的深度集成,為使用 Arm KleidiAI 軟件庫的開發者提供無縫的 AI 加速體驗。
搭載 SME2 技術的 CPU
助力實現全場景 AI 加速
搭載 SME2 的 Arm C1 CPU 集群,為實際場景中的 AI 驅動型任務帶來了顯著的 AI 性能提升,包括:
AI 性能提升高達 5 倍;
語音類工作負載延遲降低 4.7 倍;
音頻生成速度提升 2.8 倍。
全新的 Arm CPU 在 AI 計算能力上的飛躍,讓實時的端側 AI 推理成為現實,為用戶在音頻生成、計算機視覺及情境助手等多種交互場景中帶來更流暢、更快速的體驗。
在實際場景中,SME2 技術將響應速度與運行效率提升至全新水平。例如,在“智能瑜伽教練”演示應用中,得益于 SME2 技術,該應用的文本轉語音生成速度提升了 2.4 倍,這意味著用戶能即時獲得姿勢反饋與指導,且全程不用擔心設備的電池續航問題。此外,通過 Arm、支付寶與 vivo 的三方合作下,將大語言模型 (LLM) 的交互響應時間縮短了多達 40%,充分證明了 SME2 可為終端設備帶來更快速的實時生成式 AI 體驗。
SME2 技術的價值不僅在于速度的提升,更在于釋放出傳統 CPU 無法企及的 AI 驅動功能。例如,在搭載 SME2 的單個核心上運行神經攝像頭降噪功能,可以在 1080P 分辨率下實現幀率超 120 幀/秒 (fps),或在 4K 分辨率下實現幀率達 30fps。這使得智能手機用戶即使身處光線最暗的場景,也能捕捉到更銳利、清晰的圖像,進而在日常設備上獲得更流暢的操作交互與更豐富的使用體驗。
不同于受到延遲、成本及隱私問題等挑戰的云優先 AI,Lumex 將智能引入設備端,能夠在本地實現更快、更安全且隨時可用的智能體驗。SME2 已經廣受業界領先生態伙伴的采用,包括阿里巴巴、支付寶、三星 System LSI、騰訊及 vivo。
為全線產品層級賦予架構自由
Arm Lumex 為合作伙伴提供了充分的自由度,使其能從高端智能手機、PC 到新興 AI 優先設備的各類產品中,實現峰值性能、持續能效與芯片面積之間的靈活平衡。

Arm Mali GPU
實現桌面級游戲體驗和更快的 AI 推理
隨著搭載 Arm GPU 的芯片累計出貨量突破 120 億顆,Arm 持續穩居手游體驗領域的核心地位。全新的 Arm Mali G1-Ultra GPU 進一步突破移動游戲的性能邊界,為手游玩家帶來高保真、主機級畫質。這一突破得益于全新的第二代光線追蹤 (Ray Tracing Unit v2, RTUv2) 技術,該技術顯著提升光照、陰影與反射效果,使其光線追蹤性能相較前代提升了兩倍。在 AI 工作負載方面,Mali G1-Ultra 可將推理性能提升最高 20%,顯著增強各類實時應用的響應速度。
在各類圖形基準測試中,Mali G1-Ultra 較前代產品實現了 20% 的性能提升,為《暗區突圍:無限》、《堡壘之夜》、《原神》、《崩壞:星穹鐵道》等主流游戲帶來了全面的性能增強。同時,Mali G1-Premium 與 Mali G1-Pro 兩款 GPU,也為硬件資源受限的設備提供了更出色的性能與能效表現
開發者友好的端側 AI 解決方案
開發者可在 Arm Lumex 平臺上獲取開機即用的 AI 開發體驗。通過 KleidiAI 與各大主流框架的集成,包括 PyTorch ExecuTorch、Google LiteRT、阿里巴巴 MNN 及微軟 ONNX Runtime,開發者無需修改任何代碼,即可自動取得 SME2 的加速能力。
對于需要構建跨平臺應用的開發者而言,Lumex 帶來了全新的可遷移性:
Gmail、YouTube 和 Google Photos 等 Google 應用現已全面支持 SME2 ,搭載 Lumex 的設備一經上市即可無縫運行;
跨平臺可遷移性意味著針對安卓構建的優化功能可無縫擴展至采用 Arm 架構的 Windows 及其他操作系統;
支付寶等合作伙伴已成功驗證:依托 SME2 技術,終端設備上的大語言模型 (LLM) 可實現高效運行。
Apple、三星和 MediaTek 等科技領軍企業,正積極集成 AI 加速功能,推動端側 AI 向更快速、更高效的方向發展。其中,Apple 正憑借該能力為“蘋果智能” (Apple Intelligence) 提供核心支撐;三星與 MediaTek 則借助 Google Gemini 提升翻譯、摘要、個人助手等實時 AI 應用的響應速度與運行效率。
Arm Lumex
AI 時代的平臺級智能
Arm Lumex 不僅是 Arm 面向消費計算市場的最先進 CSS 平臺,更是開啟新時代智能 AI 體驗的基石。無論是 OEM 廠商還是開發者,Lumex 均可提供所需工具,助力其在關鍵端側場景實現兼具個性化、隱私保障與高性能的 AI 體驗。作為專為 AI 時代打造平臺, Arm Lumex 將成為未來移動創新的全新起點。
合作伙伴證言
阿里巴巴淘天集團業務技術 MNN 負責人姜霄棠:“通過與 SME2 的深度集成,MNN 現已能在智能手機端,為通義千問等十億參數級的大模型提供低延遲的量化推理能力。這一成果充分體現了 Arm 與阿里巴巴在共同推動下一代可擴展移動 AI 技術發展中的創新實力。”
支付寶終端技術負責人翁欣旦:“在 Arm、支付寶與 vivo 的三方密切協作下,支付寶已在 vivo 新一代旗艦智能手機上完成了基于 Arm SME2 技術的大語言模型推理驗證。結果顯示,在預填充 (prefill) 與解碼 (decode) 階段,性能分別實現了超過 40% 和 25% 的提升。這標志著 CPU 后端能力的重大突破。我們對迄今為止所取得的成果倍感鼓舞。我們相信,隨著 xNN 的持續演進,以及與 SME2 的深度融合,支付寶有望在更多場景進一步發揮 AI的 潛能,構建更智能、更安全、更個性化的服務生態。”
Google 安卓平臺杰出軟件工程師Iliyan Malchev:“得益于 SME2 技術增強的硬件,像 Gemma 3 這樣更先進的 AI 模型能夠直接在各類設備上運行。隨著 SME2 的持續擴展,移動開發者將能在整個生態系統中無縫部署新一代 AI 功能,最終讓終端用戶在他們智能手機上隨時享受低延遲的 AI 體驗。”
Meta 人工智能合作部總監Sy Choudhury:“AI 正在重塑我們與設備、與周圍世界的互動方式,而 Arm 生態系統正推動該領域的關鍵技術突破。在 Meta,我們對 Arm Kleidi 與 PyTorch 框架下 ExecuTorch 工具的集成感到興奮,這一集成將讓我們的應用得以在下一代技術平臺上無縫運行,進而為終端用戶帶來體驗的顯著加速。”
三星電子副總裁兼 SOC IP 開發團隊負責人Nak Hee Seong:“在三星,我們很高興能繼續與 Arm 合作,基于 Arm Lumex CSS 平臺開發下一代旗艦移動產品。這一合作使我們能夠持續突破端側 AI 的邊界,為用戶帶來更智能、更迅捷、更高效的體驗。”
騰訊機器學習平臺專家楊曉峰:“SME2 技術通過突破關鍵性能瓶頸,高效助力大語言模型在移動端落地部署,如騰訊混元大模型,為端側大語言模型提供強勁加速,最終帶來更優質的用戶體驗。”
-
ARM
+關注
關注
135文章
9552瀏覽量
391856 -
cpu
+關注
關注
68文章
11277瀏覽量
224956 -
AI
+關注
關注
91文章
39768瀏覽量
301370
原文標題:Arm 全新 Lumex CSS 平臺實現兩位數性能提升,驅動消費電子設備“更智能、更高效、更個性化”
文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
如何在Arm Neoverse N2平臺上提升llama.cpp擴展性能
西門子EDA與Arm攜手合作加速系統設計驗證進程與軟件啟動
Arm架構助力Azure Cobalt 100虛擬機工作負載性能提升
Arm Lumex平臺賦能新一代旗艦智能手機體驗升級
全新升級MokuOS 4.0,簡化跨設備平臺協同交互
Arm正式取消Cortex命名!CPU向著高算力進發,Lumex CSS平臺加持!
全新Arm Lumex CSS平臺加速開發周期
Arm Zena CSS加速軟件和芯片開發進程
Arm神經技術是業界首創在 Arm GPU 上增添專用神經加速器的技術,移動設備上實現PC級別的AI圖形性能
Arm KleidiAI與XNNPack集成實現AI性能提升
Arm Neoverse N2平臺實現DeepSeek-R1滿血版部署
Arm 公司面向 PC 市場的 ?Arm Niva? 深度解讀
Arm 公司面向移動端市場的 ?Arm Lumex? 深度解讀
Arm 公司面向汽車市場的 ?Arm Zena? 深度解讀
營收和凈利均兩位數增長 杰普特從有質量的活著到有質量的增長轉變
全新Arm Lumex CSS平臺實現兩位數性能提升
評論