国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Arm發布基于Armv9架構的Cortex-A320處理器

Arm社區 ? 來源:Arm社區 ? 2025-02-27 17:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 物聯網事業部高級產品經理 Dimosthenis Rossidis

在當前持續演進的物聯網 (IoT) 環境中,軟件復雜性不斷增加,邊緣設備因而需要更勝以往的性能、能效和安全性。Arm Cortex-A 系列產品通過為功率有限的設備帶來先進的計算功能,進而滿足這一需求,并為多樣化的市場提供增強的人工智能 (AI) 處理能力、強大的安全性和優化的能效。Cortex-A3xx 系列專為包括消費類電子設備和云服務等在內的各種細分市場提供超高能效解決方案和優化的性能。更重要的是,該系列 CPU 為快速增長的高度多樣化物聯網市場提供了性能強勁且可擴展的解決方案,使其成為邊緣 AI 應用的理想之選。

邊緣 AI 需要更卓越的計算性能、更強大的安全性,以及更出色的軟件靈活性。隨著軟件愈發復雜化,Armv9 架構應運而生,以提供先進的機器學習 (ML) 和 AI 功能,并具備增強的安全特性。該架構現已在 Cortex-A3xx 的超高能效系列實現,為新一代邊緣 AI 應用夯實根基。

Cortex-A320:最小型的 Armv9 架構實現

Arm 今日發布的 Cortex-A320 是首款基于 Armv9 架構的超高能效 Cortex-A 處理器。這是一款基于 Armv9.2-A 架構的 AArch64 CPU。其微架構源自 Cortex-A520,并經過顯著優化,以改善面積和功耗。

Cortex-A320 的能效相較 Cortex-A520 提高了 50% 以上。這一提升是通過多次微架構的更新而實現,其中包括窄取和解碼數據路徑、密集存儲的 L1 緩存、縮減端口的整數寄存器文件等優化。

得益于高能效的分支預測器和預取器,以及內存系統的提升等微架構上的顯著創新,Cortex-A320 在 SPECINT2K6 基準測試中的標量性能相比其前代產品 Cortex-A35 提升了 30% 以上。

更重要的是,通過集成增強的Armv9 的 Neon 和 SVE2 向量處理技術,在 INT8 通用矩陣乘法 (GEMM) 中測得 Cortex-A320 的 ML 處理能力比 Cortex-A35 高出至多 10 倍。此外,通過對 BF16 等新的數據類型、新的點積和矩陣乘法指令的支持,Cortex-A320 的 ML 性能比目前全球最受歡迎的 Armv8-A CPU Cortex-A53 高出至多六倍。

Cortex-A320 在 ML 能力的大幅提升,以及極高的面積能效比,使其在 ML 應用中成為最高能效的 Cortex-A CPU 核心。

與 Arm Cortex-M 處理器相比,Cortex-A320 的 ML 性能同樣提高了數倍。例如,在 GEMM 性能方面,Cortex-A320 相較目前性能最高的 Cortex-M CPU (Cortex-M85) 提高了八倍。這種性能提升不僅歸功于 Armv9 架構在 AI 處理上的增強,還源于 Cortex-A320 內存訪問性能的大幅提高和頻率的增加。

與此同時,得益于 Arm 的 A 處理器架構、多核執行,以及靈活的內存管理,這使 Cotex-A320 成為 Cortex-M 系列微處理器進行性能升級的合適選項。

通過微架構優化,實現更高能效

Cortex-A320 是一款單發射、32 位指令取指的有序執行 CPU,實現了優化的八級管線,且具有緊湊的轉發網絡,從而達到比 Cortex-A520 更高的頻點。

Cortex-A320 提供從單核到四核配置的集群內擴展。該 CPU 所采用的簡化 DynamIQ Shared Unit (DSU) DSU-120T,可支持僅使用 Cortex-A320 的集群。DSU-120T 是最小的 DSU 實現,能夠顯著降低復雜性、面積和功耗,進而大幅提升基于 Cortex-A 的入門系列產品的能效。

Cortex-A320 支持高達 64KB 的 L1 緩存和高達 512KB 的 L2 緩存,并且具有可連接到外部存儲器的 256 位 AMBA5 AXI 接口。L2 緩存和 L2 TLB 可以在 Cortex-A320 CPU 之間共享,而實現 Neon 和 SVE2 SIMD 技術的向量處理單元既可在單核復合體中專用,也可在雙核或四核實現中由兩個核共享。

針對不同市場的多樣化優勢

得益于廣泛的開源 Linux 支持、強大的安全生態系統,以及 Armv9 架構所取得的關鍵進展,Cortex-A320 可確保與邊緣側和基礎設施設備兼容,同時具備出色能效和可擴展性。

Neon 和 SVE2 向量處理技術更新提升了 ML 性能,除此之外,Armv9 架構還大大增強了安全性,這對于物聯網和嵌入式系統至關重要。Cortex-A320 為 Cortex-A 的超高能效系列引入了重要的安全特性,包括增強內存安全性的內存標記擴展 (MTE),以及可減少跳轉導向編程和返回導向編程攻擊的指針驗證 (PAC) 和分支目標識別 (BTI)。

Secure EL2 是 Cortex-A320 所采用的其中一項 Armv9 關鍵特性,通過增強 TrustZone 中的軟件隔離,有助于在邊緣設備上安全執行軟件容器。

從入門級通用 MPU、智能揚聲器、軟件定義智能攝像頭,到工廠車間內的自動駕駛車輛、自動化邊緣 AI 助手、AI 人機界面和機器人控制器,Cortex-A320 可在廣泛的應用中發揮上述優勢。除邊緣 AI 應用外,Cortex-A320 還可惠及包括智能手表和智能可穿戴設備,以及服務器基板管理控制器 (BMC) 等基礎設施設備在內的眾多關鍵細分市場。

Cortex-A320 也非常適合于以往使用高性能 Cortex-M 的應用,如電池供電的 MCU 用例或運行實時操作系統 (RTOS) 的應用,這些應用需要通過對稱多處理來擴展性能,而 Arm 的 A 處理器架構開箱即支持。

此外,它還可用于需要 Cortex-A 內存管理或地址轉換特性的 RTOS 應用,以增強軟件的靈活性。例如,Cortex-A320 適合于需要在 MCU 設備上下載應用的用例,由于其需要內存管理單元 (MMU) 來跨內存映射進行代碼重新定位。

與此同時,更寬的尋址空間使得 Cortex-A320 成為異構多核用例的高能效解決方案,在這些用例中,性能更高的 Cortex-A 與微控制器級核心相結合。借助 Cortex-A320,Arm 的合作伙伴能夠將小型架構兼容的核心搭配較大的 Cortex-A 處理器,從而簡化內存架構。

另一方面,由于其所具備的 A 處理器架構特性,Cortex-A320 可以提供開箱即用的 Linux 支持,并為安卓系統等現有的功能豐富的操作系統提供軟件可移植性。Cortex-A320 具備出色的靈活性,適用于眾多細分市場、應用和操作系統。

引入 Armv9 邊緣 AI 異構計算平臺

Arm Ethos-U85 NPU 旨在應對 Cortex-A 系統中的常見高延遲內存,并與 Cortex-A320 處理器協作良好。

Ethos-U85 驅動程序已完成更新,該 NPU 現可直接由 Cortex-A320 驅動,而無需基于 Cortex-M 的 ML 島。這一更新不僅改善了延遲,還為 Arm 的合作伙伴免去了使用 Cortex-M 來驅動 NPU 的成本和復雜性。

此外,Cortex-A320 的內存訪問性能和增強的內存系統使其能夠執行更大規模的 ML 模型,例如超過 10 億個參數的大語言模型 (LLM)。由于可尋址內存空間有限,這些模型很難在基于 Cortex-M 的系統上高效運行。

Ethos-U NPU 通過量化數據類型,來滿足邊緣 AI 用例有限的成本和能耗要求。Ethos-U85 不支持的 ML 算子和數據類型都將自動回調到 Cortex-A320 上進行處理,并利用 Neon/SVE2 引擎進行加速。

Armv9 架構實現了顯著的 ML 性能提升,得益于此,在 2GHz 頻率下運行,以 8 位 MAC/周期測得,四核 Cortex-A320 可以執行高達 256 GOPS。因此,無需外部加速器,Cortex-A320 便可直接在 CPU 上運行高級 ML 和 AI 用例。這為針對各種 ML 和 AI 應用的設備節省了系統面積、功耗和復雜性,并帶來最高可達 0.25 TOP 的表現。

邊緣 AI 新時代未來可期

Cortex-A320 將 Armv9 架構的安全性和卓越的 AI 性能引入了 Cortex-A 的超高能效系列,為軟件開發者提供了開發和部署更嚴苛用例的新可能,開創了邊緣 AI 設備的新時代。通過結合 Arm 的 A 處理器架構及相關的軟件生態系統,并在高能效和靈活性支持下,Cortex-A320 為物聯網領域的各個細分市場提供了卓越的可擴展性和多樣化。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    135

    文章

    9552

    瀏覽量

    391838
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11277

    瀏覽量

    224946
  • 物聯網
    +關注

    關注

    2945

    文章

    47818

    瀏覽量

    414819

原文標題:詳解 Arm Cortex-A320,針對物聯網優化的超高能效 Armv9 CPU

文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Cortex-M0 處理器介紹

    功耗的32位處理器Cortex-M0是Cortex-M家族中的M0系列。最大特點是低功耗的設計。Cortex-M0為32位、3級流水線RISC
    發表于 01-16 08:04

    GM9-3003-20龍芯3A6000處理器,自主架構引領工業算力?

    3A6000處理器,以全棧國產化設計、強勁算力與豐富擴展接口,為工業場景提供高可靠、高安全的計算平臺,徹底擺脫對進口芯片的依賴。 ?****核心性能:龍芯 3A6000處理器,自主
    的頭像 發表于 01-13 16:52 ?1421次閱讀
    GM<b class='flag-5'>9</b>-3003-20龍芯3<b class='flag-5'>A</b>6000<b class='flag-5'>處理器</b>,自主<b class='flag-5'>架構</b>引領工業算力?

    Genio 720處理器規格參數_MTK8391高算力核心板方案

    Genio 720(MT8391)處理器規格參數,采用先進的6nm制程工藝,兼顧高性能與低功耗,適配無風扇設計及電池供電移動設備需求。CPU架構:八核處理器,包含2顆Arm
    的頭像 發表于 01-12 19:57 ?280次閱讀
    Genio 720<b class='flag-5'>處理器</b>規格參數_MTK8391高算力核心板方案

    Arm Flexible Access方案引入Armv9邊緣AI計算平臺

    全球首個 Armv9 邊緣 AI 計算平臺(專為物聯網及邊緣 AI 工作負載優化)將納入 Arm Flexible Access 方案,助力創新者以低成本、便捷的方式,在邊緣側獲得先進的 AI 性能與安全保障
    的頭像 發表于 10-29 15:27 ?1044次閱讀

    基于蜂鳥E203架構的指令集K擴展

    向量操作指令,例如向量加法、向量乘法等。 在蜂鳥E203架構中,可以添加K擴展指令集,以處理大規模的數據集,可以添加以下指令: 1.VADD:向量加法指令,將兩個向量相加并存儲結果到一個向量寄存
    發表于 10-21 09:38

    迅為Hi3403V610開發板海思Cortex-A55架構核心板卡

    迅為電子重磅推出基于海思Hi3403處理器的高性能核心板,采用先進的四核Cortex-A55架構,主頻高達1.4GHz,以強勁算力、超凡能效比與卓越的圖像處理能力,為千行百業的智能化升
    的頭像 發表于 09-30 14:18 ?686次閱讀
    迅為Hi3403V610開發板海思<b class='flag-5'>Cortex-A</b>55<b class='flag-5'>架構</b>核心板卡

    Texas Instruments DRA821x Jacinto? 64位處理器技術解析

    Texas Instruments DRA821x Jacinto? 64位處理器基于ARM?v8架構,并為帶有云連接性的網關系統進行了優化。片上系統 (SoC) 設計通過集成降低了系統級成本
    的頭像 發表于 08-28 11:33 ?1083次閱讀
    Texas Instruments DRA821x Jacinto? 64位<b class='flag-5'>處理器</b>技術解析

    德州儀器AM68x Jacinto 8處理器技術解析

    Texas Instruments AM68x 64位Jacinto? 8 TOPS Vision SoC處理器是一款基于Eval Jacinto 7架構的可擴展處理器。該系列面向智能視覺攝像機
    的頭像 發表于 08-27 15:08 ?1110次閱讀
    德州儀器AM68x Jacinto 8<b class='flag-5'>處理器</b>技術解析

    國產信創工業計算機海光3350處理器集特IPC-660工控機

    國產信創新標桿:集特IPC-660工控機搭載海光3350賦能工業自主化在工業4.0與信創國產化雙軌并行的時代,海光3350處理器憑借自主可控的x86架構與工業級高性能,正成為關鍵基礎設施的核心算力
    的頭像 發表于 06-24 15:32 ?2801次閱讀
    國產信創工業計算機海光3350<b class='flag-5'>處理器</b>集特IPC-660工控機

    基于RK3576處理器,EASY EAI Orin Nano開發板免費試用

    EASY EAI Orin Nano是廣州靈眸科技有限公司的旗艦級硬件產品。基于瑞芯微的RK3576處理器設計,集成了4個Cortex-A72和4個Cortex-A53及支持NEON指令集,支持
    的頭像 發表于 06-09 15:01 ?1411次閱讀
    基于RK3576<b class='flag-5'>處理器</b>,EASY EAI Orin Nano開發板免費試用

    在IAR Embedded Workbench for Arm中使用Arm Cortex-R52 NEON

    隨著嵌入式系統變得越來越智能,對嵌入式處理器的要求也越來越高。為了更好應對汽車、醫療和工業機器人等領域對嵌入式處理器的要求,Arm推出了采用Armv8-R
    的頭像 發表于 06-05 09:57 ?1860次閱讀
    在IAR Embedded Workbench for <b class='flag-5'>Arm</b>中使用<b class='flag-5'>Arm</b> <b class='flag-5'>Cortex</b>-R52 NEON

    MT8768處理器規格參數_MTK8768聯發科安卓核心板定制開發

    先進制程工藝,搭載八核ARM Cortex-A53架構,主頻高達2.0GHz,運行穩定且高效,支持Android 11操作系統,成為低功耗和高性能應用的理想選擇。
    的頭像 發表于 05-29 19:59 ?2714次閱讀
    MT8768<b class='flag-5'>處理器</b>規格參數_MTK8768聯發科安卓核心板定制開發

    ARM服務解決方案

    可控制在15W以下,較x86架構能效比提升50%以上,尤其適合邊緣計算和輕量級并發場景。 彈性擴展能力? 模塊化設計支持通過增減處理器節點快速調整算力,硬件成本較x86架構低30%-40%,結合容器化技術實現動態資源調配。 異構
    的頭像 發表于 05-16 07:44 ?1098次閱讀
    <b class='flag-5'>ARM</b>服務<b class='flag-5'>器</b>解決方案

    iTOP-3588開發板采用瑞芯微RK3588處理器四核心架構GPU內置獨立NPU強大的視頻編解碼

    性能強 iTOP-3588開發板采用瑞芯微RK3588處理器,是全新- -代AloT高端 應用芯片,采用8nm LP制程,搭載八核64位CPU,四核Cortex-A76 和四核Cortex-A
    發表于 04-09 16:09

    Arm 推出 Armv9 邊緣 AI 計算平臺,以超高能效與先進 AI 能力賦能物聯網革新

    架構的超高能效 CPU——Arm Cortex-A320 以及對 Transformer 網絡具有原生支持的 Ethos-U85 AI 加速為核心的邊緣AI 計算平臺,可支持運行超
    的頭像 發表于 03-06 11:43 ?2053次閱讀
    <b class='flag-5'>Arm</b> 推出 <b class='flag-5'>Armv9</b> 邊緣 AI 計算平臺,以超高能效與先進 AI 能力賦能物聯網革新