国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Arm解讀Armv9 CPU為何是打造高性能、高能效移動計算的關鍵

Arm社區(qū) ? 來源:Arm ? 2025-03-14 15:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 終端事業(yè)部產(chǎn)品管理高級總監(jiān) Stefan Rosinger

在之前有關 Arm Cortex-X925 CPU 的文章中,Arm 技術專家曾探討了每時鐘周期指令數(shù) (IPC) 作為評估 CPU 性能的關鍵指標的重要性。與主要將頻率作為性能指標的做法不同,IPC 衡量的是 CPU 每個時鐘周期內(nèi)能處理的指令數(shù)。對于移動設備而言,電池續(xù)航和散熱管理是影響實際應用、用戶體驗和設備處理復雜工作負載的關鍵所在。因而,IPC 對于評估移動設備性能而言,至關重要。

更高的頻率 ≠ 最優(yōu)表現(xiàn)

IPC 越高,表示在一個時鐘周期內(nèi)執(zhí)行的指令越多;即便時鐘速度較慢,也能帶來更好的性能。這對于內(nèi)存受限的工作負載尤為重要,因為其性能會受到 CPU 外部因素的制約。更高的 IPC 使得 CPU 能以更低的頻率運行,從而減少電量消耗和功耗,設備發(fā)熱也會緩解。這對于需要保持穩(wěn)定性能的移動設備來說,尤為有利。

雖然高頻 CPU 乍聽起來很有吸引力,但它并不能反映性能的全貌。頻率表示 CPU 每秒完成的時鐘周期數(shù)量,而 IPC 則表示每個周期所完成的工作量。事實上,最高頻率很少會用到。例如,對于游戲和其他算力要求較高的工作負載來說,并不會以最大頻率使用 CPU,大多數(shù)時間反而是以中檔頻率運行。此時的能效更高,可以延長電池續(xù)航時間并降低設備溫度,而這兩者是提升整體用戶體驗的重要指標。

在相同的時間周期內(nèi),具有更高 IPC 的 CPU 在處理實際應用和復雜工作負載時會表現(xiàn)出更優(yōu)的性能。即便是當今具有復雜計算需求的 AI 應用(例如聊天機器人、實時語言翻譯和虛擬助手),在 IPC 更高的 CPU 上運行時也會表現(xiàn)得更加出色。此外,就能效而言,在一個周期內(nèi)執(zhí)行更多的指令意味著可以更快地完成任務,使得 CPU 處于高能耗狀態(tài)的時間減少,從而節(jié)省電池電量。

卓越的架構設計

在基于 Armv9 架構的 CPU 設計中,可伸縮向量擴展 (SVE2) 是提高 IPC 的關鍵所在。這一架構特性采用新的專用向量指令,是加速智能手機關鍵工作負載和應用的理想之選。

SVE2 可將 HDR 視頻解碼速度提高約 10%,這樣用戶在主流應用上觀看點播視頻時,能獲得更長的電池續(xù)航時間。此外,通過加速常用的圖像處理庫,SVE2 還增強了視頻通話期間用戶體驗的流暢度,同時提高了畫面質(zhì)量。其中包括更好的攝像頭旋轉(zhuǎn)體驗,以及圖像濾鏡的切換和使用體驗。

不僅如此,SVE2 還不受向量長度的影響,這意味著代碼開發(fā)將支持更大的向量長度,例如 256 位。由此可確保與移動計算未來發(fā)展的兼容性,包括未來更注重邏輯擴展,而非 RAM 的先進工藝節(jié)點。移動端市場將因此能夠適應更大的向量長度,有利于游戲和 AI 模型中 SVE 代碼的呈現(xiàn)。

通過深入研究設計,IPC 性能可借助一系列特定的微架構改進得以提高。其中包括但不限于:

超標量亂序執(zhí)行

分支預測和預取器

數(shù)據(jù)推測

適當?shù)木彺孢x擇

Arm Cortex CPU 一直在逐年推進各種類似的微架構改進,以實現(xiàn)更高的性能水平。

面向移動端的最新 Armv9 CPU

上述的架構特性和微架構提升是 Arm 面向移動端市場的最新 Armv9 CPU 的核心所在。作為 MediaTek 天璣 9400(已被搭載于 vivo X200 系列等旗艦智能手機)的核心,Cortex-X925 對私有 L2 緩存進行了升級,從 2MB 增加到 3MB。再加上 Cortex-X925 能夠更加快速、高效地預取數(shù)據(jù)和復雜指令,從而顯著增強了 CPU 的整體性能和能效。得益于此,Arm 計算平臺在 2024 年實現(xiàn)了驚人的兩位數(shù) IPC 性能提升。

如此一來,終端用戶能夠享受到一系列實際性能的提升,包括更快的應用響應速度、更好的游戲體驗、更流暢的視頻流媒體傳輸、更快的網(wǎng)頁瀏覽和順暢的多任務處理。同時,更高的 IPC 也帶來了能效的提升,延長了用戶的沉浸式體驗。

與此同時,Cortex-A725 作為 CPU 工作負載的主力,也進行了一系列針對性更新,著力于需要持續(xù)出色性能的關鍵 AI 和游戲用例。與 Cortex-A720 相比,Cortex-A725 的性能效率提升了 35%,能效提升了 25%。

在 Armv9.2 集群中,每個 CPU 組件都能應對廣泛的實際用例和復雜的工作負載。例如,Cortex-X925 可處理應用啟動和網(wǎng)頁瀏覽的“突發(fā)”工作負載,而 Cortex-A725 則可以在常見的移動端用例(包括游戲、網(wǎng)頁瀏覽、基于攝像頭的應用和視頻流媒體)中持續(xù)提供穩(wěn)定性能,以延長設備的使用時間(即電量耗盡之前,用戶可在設備上使用某些用例的平均時間)。

打造無可比擬的移動端體驗

從根本上說,移動設備需要兼具性能與能效,而 IPC 的提升恰好能同時滿足這個需求。用戶因而能更長時間體驗各種需要高算力的應用。最新的 Armv9 CPU 將卓越的 IPC 水平與高時鐘頻率相結(jié)合,將性能和能效提升到一個更高的水平,從而為最終用戶帶來更加出色的用戶體驗。這也正是為什么全球 99% 的智能手機都基于 Arm 計算平臺打造的原因之一。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    135

    文章

    9552

    瀏覽量

    391827
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11277

    瀏覽量

    224938
  • IPC
    IPC
    +關注

    關注

    3

    文章

    378

    瀏覽量

    54882
  • 移動計算
    +關注

    關注

    0

    文章

    31

    瀏覽量

    10462

原文標題:內(nèi)有劇透!打造高性能、高能效移動計算的關鍵是?

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Arm率先適配騰訊混元HY-1.8B-2Bit模型

    計算平臺,Arm 率先完成了對該模型的成功適配。HY-1.8B-2Bit 現(xiàn)已能夠在搭載啟用第二代可伸縮矩陣擴展 (SME2) 技術的 Armv9 計算平臺的
    的頭像 發(fā)表于 02-10 17:29 ?1849次閱讀

    Arm Unlocked 2025深圳站圓滿落幕

    繼上海、首爾站之后,Arm Unlocked 2025 AI 技術峰會深圳站圓滿落幕。在面對持續(xù)增長的人工智能 (AI) 算力需求,Arm 正持續(xù)推進“平臺優(yōu)先”戰(zhàn)略,在高性能高能
    的頭像 發(fā)表于 11-04 18:01 ?1342次閱讀

    Arm Flexible Access方案引入Armv9邊緣AI計算平臺

    全球首個 Armv9 邊緣 AI 計算平臺(專為物聯(lián)網(wǎng)及邊緣 AI 工作負載優(yōu)化)將納入 Arm Flexible Access 方案,助力創(chuàng)新者以低成本、便捷的方式,在邊緣側(cè)獲得先進的 AI
    的頭像 發(fā)表于 10-29 15:27 ?1044次閱讀

    負載減少50%!Arm用AI重新定義移動端圖形渲染

    是一項非常艱巨的任務。 ? Arm 終端事業(yè)部產(chǎn)品管理總監(jiān) Steve Steele 表示,Arm 始終專注于為市場提供高能計算能力,特
    發(fā)表于 08-20 08:00 ?4009次閱讀
    負載減少50%!<b class='flag-5'>Arm</b>用AI重新定義<b class='flag-5'>移動</b>端圖形渲染

    探索CPU架構的奧秘,揭秘高性能計算的隱形引擎

    的深海,揭開那些隱藏在高性能計算背后的神秘面紗。1.取指令(Fetch)程序計數(shù)器(PC):CPU通過程序計數(shù)器獲取下一條指令的內(nèi)存地址。指令讀取:從存儲器或緩存中讀
    的頭像 發(fā)表于 08-13 11:58 ?789次閱讀
    探索<b class='flag-5'>CPU</b>架構的奧秘,揭秘<b class='flag-5'>高性能</b><b class='flag-5'>計算</b>的隱形引擎

    優(yōu)化電機控制以提高能

    的電機系統(tǒng)。 電機材料與設計的持續(xù)改進,已推動能性能取得重大突破。從非晶材料與高性能磁體的應用,到軸承技術的演進及電機體積的縮減,這些創(chuàng)新正引領著電機技術的未來發(fā)展。隨著對新材料和新設計的不斷探索
    發(fā)表于 06-11 09:57

    ARM Mali GPU 深度解讀

    ARM Mali GPU 深度解讀 ARM Mali 是 Arm 公司面向移動設備、嵌入式系統(tǒng)和基礎設施市場設計的圖形處理器(GPU)IP
    的頭像 發(fā)表于 05-29 10:12 ?4313次閱讀

    Arm 公司面向 PC 市場的 ?Arm Niva? 深度解讀

    面向 PC 市場的 ? Arm Niva ? 深度解讀 ? Arm Niva ? 是 Arm 公司為 PC 市場推出的核心計算平臺,屬于其“
    的頭像 發(fā)表于 05-29 09:56 ?1630次閱讀

    Arm 公司面向移動端市場的 ?Arm Lumex? 深度解讀

    子系統(tǒng)(CSS)? ? 在移動端的落地形態(tài),Lumex 旨在通過高度集成化的軟硬件方案,解決移動設備在 AI 性能、能比與開發(fā)效率上的挑戰(zhàn)。以下從技術架構、
    的頭像 發(fā)表于 05-29 09:54 ?4375次閱讀

    Arm 公司面向汽車市場的 ?Arm Zena? 深度解讀

    面向汽車市場的 ? Arm Zena ? 深度解讀 Arm Zena 是 Arm 公司面向智能汽車領域推出的核心計算平臺,屬于其“平臺優(yōu)先”
    的頭像 發(fā)表于 05-29 09:51 ?2457次閱讀

    ARM最強超大核Cortex-X925與小米玄戒O1的深度解析

    ARM Cortex-X925:架構革新與性能巔峰的全新標桿 作為ARM迄今最強大的CPU核心,Cortex-X925基于Armv9.2-A
    的頭像 發(fā)表于 05-23 15:29 ?3602次閱讀

    ARM服務器解決方案

    可控制在15W以下,較x86架構能比提升50%以上,尤其適合邊緣計算和輕量級并發(fā)場景。 彈性擴展能力? 模塊化設計支持通過增減處理器節(jié)點快速調(diào)整算力,硬件成本較x86架構低30%-40%,結(jié)合容器化技術實現(xiàn)動態(tài)資源調(diào)配。 異構計算
    的頭像 發(fā)表于 05-16 07:44 ?1098次閱讀
    <b class='flag-5'>ARM</b>服務器解決方案

    MWC2025亮點放送 探索Arm如何塑造移動端技術未來

    ,彰顯了人工智能 (AI) 和移動端技術之間的共生關系。 ?Arm 計算平臺賦能從云到邊的 AI 體驗。Arm 通過提供端到端的高能
    的頭像 發(fā)表于 03-14 15:40 ?1458次閱讀
    MWC2025亮點放送 探索<b class='flag-5'>Arm</b>如何塑造<b class='flag-5'>移動</b>端技術未來

    Arm 推出 Armv9 邊緣 AI 計算平臺,以超高能與先進 AI 能力賦能物聯(lián)網(wǎng)革新

    架構的超高能 CPU——Arm Cortex-A320 以及對 Transformer 網(wǎng)絡具有原生支持的 Ethos-U85 AI 加速器為核心的邊緣AI
    的頭像 發(fā)表于 03-06 11:43 ?2053次閱讀
    <b class='flag-5'>Arm</b> 推出 <b class='flag-5'>Armv9</b> 邊緣 AI <b class='flag-5'>計算</b>平臺,以超<b class='flag-5'>高能</b><b class='flag-5'>效</b>與先進 AI 能力賦能物聯(lián)網(wǎng)革新

    搶先試用此芯Armv9 AI PC開發(fā)套件瑞莎“星睿O6”

    、邊緣、機器人等不同場景的“星睿O6”開發(fā)套件 。 該套件于2024年12月發(fā)布,異構集成Armv9 CPU核心、Arm Immortalis GPU及安謀科技“周易”NPU等自研業(yè)務產(chǎn)品,具備強大的多媒體處理能力,并支持靈活的
    的頭像 發(fā)表于 03-06 08:09 ?1392次閱讀
    搶先試用此芯<b class='flag-5'>Armv9</b> AI PC開發(fā)套件瑞莎“星睿O6”