国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Arm架構是如何開發的

Arm社區 ? 來源:Arm社區 ? 2023-11-23 16:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 架構與技術部產品管理總監 Martin Weidmann

隨著人工智能 (AI) 的興起和安全威脅的加劇,計算需求不斷提高。全球各種設備所依賴的基礎計算架構也必須持續向前推進。為此,我們的工程團隊不斷地在應用廣泛的 Arm 架構中加入新的功能和技術,同時我們的軟件團隊也在努力讓軟件能夠順利地適配這些未來的功能和技術。

Arm 架構是如何開發的

Arm 每年都會發布 Arm 指令集架構 (ISA) 的更新,這些更新是通過與 Arm 生態系統中的各類合作伙伴合作參與創建的。該流程涉及芯片合作伙伴、操作系統供應商、OEM 廠商,以及 Arm 內部的工程團隊和多家標準組織。

經過精心設計的 ISA 可確保軟件在未來數年內持續兼容新舊硬件。Arm 與 Linaro 等眾多合作伙伴緊密協作,讓諸如 Linux 內核和發行版等廣泛使用的軟件上游社區能支持 Arm ISA,以便建立龐大的開發者生態系統。

每年九月,我們都會發表一篇技術博客,分享該年度對 A-Profile 架構所作的一些重要增添。同時,我們也會在 Arm 開發者網站上發布完整的指令集和系統寄存器文檔[1]。

完整的 Arm 架構參考手冊[2] (Arm Architecture Reference Manual, Arm ARM) 也會每年更新一次。預計 2024 年初會發布包含 2023 年擴展內容的更新版。“學習架構 (Learn the Architecture)”[3]頁面同樣會在 2023 年和 2024 年更新。

技術博客和文檔的發布只是部署新架構的一小步。接下來我們還要同生態合作伙伴一起努力,確保一旦硬件準備就緒,開源軟件就能即刻支持新的架構功能。

2023 年,Arm 推出新特性以加強對人工智能 (AI)、機器學習 (ML) 和安全性的支持。Arm 架構的首要任務之一是讓安全的 AI 無處不在,而神經網絡 (NN) 的訓練是 AI 不斷進步和發展的關鍵。因此,2023 年的架構擴展增加了已在神經網絡中廣泛使用的新八位浮點格式,名為 FP8。為了提高安全性,我們還增加了“經檢查的指令運算 (Checked Pointer Arithmetic)”功能,該功能基于 Arm 內存標記擴展 (MTE)[4] 的現有支持而打造,可以幫助開發者快速發現內存安全違規,節省應用開發的成本和時間。

以下為今年新增的功能:

FP8

2022 年,Arm、Intel 和 Nvidia 宣布針對 FP8 展開合作。FP8 是一種交換格式,可以讓軟件生態系統輕松共享神經網絡模型,并讓 AI 計算能力不斷提高。作為 2023 年擴展的一部分,SME2、SVE2 和 Advanced SIMD (Neon) 增加了對 FP8 的支持。

FP8 支持兩種數據格式:E5M2 和 E4M3。這兩種格式在精度和范圍上有不同的取舍。

aa8b2f5a-7855-11ee-939d-92fbcf53809c.png

使用哪種格式由 FPMR 寄存器中的字段選擇。對于一條指令的不同輸入,可以選擇不同的格式,從而有效地處理各種格式的數據集。我們堅信,圍繞八位浮點格式的行業共創將帶來一系列好處,同時可使開發者專注于真正重要的創新和差異化。我們非常高興看到 FP8 將推動未來 AI 的發展。

熱遷移

熱遷移是指將虛擬機 (VM) 從一臺主機移動到另一臺主機上,而不影響其可用性和狀態。能夠高效地進行熱遷移對于大規模數據中心管理而言非常重要。

為了實現熱遷移,虛擬機管理程序要在 VM 仍在舊主機上運行時,就把它所占用的頁面復制到新主機上。這個過程通常要反復進行幾次,因為 VM 可能會修改已經復制的頁面。解決這個問題有不同的方法,但都要面對三項挑戰:

記錄:記錄 VM 修改過(污染過)的頁面。

調查:根據記錄判斷哪些頁面需要重新復制。

清理:每次迭代時重置記錄機制。

2023 年的擴展增加了幾項功能,可以幫助優化上述的三項挑戰。

FEAT_HDBSS 讓我們可以記錄日志,記錄 Stage 2 已被污染的頁面或塊。該機制解決了“記錄”成本問題,因為內存管理單元 (MMU) 可以在不中斷 VM 執行的情況下高效創建日志。日志也解決了“調查”成本問題,因為生成的數據是虛擬機管理程序可以有效使用的格式。

aad8ab18-7855-11ee-939d-92fbcf53809c.png

為了解決“清理”成本問題,FEAT_HACDBS 增加了一個加速器來清理 Stage 2 轉換表中的污染狀態。引擎利用污染頁面日志來定位需要更新的 Stage 2 轉換表描述符。

這些功能結合起來可以大幅提高熱遷移的性能和效率。

經檢查的指令運算

AArch64 支持多項功能,這些功能讓我們可以重新利用保存地址的寄存器高位。例如,Armv8.0-A 中引入的標記指針 (Tagged Pointer) 和 Armv8.5-A 中引入的 MTE。

軟件經常需要操作指針,比如給一個基地址加上一個偏移量。這通常是用加法或減法等常規算術運算來完成的。如果地址計算出現溢出,就可能會破壞寄存器中非地址位的信息。例如,如果使用 MTE,地址操作則可能會改變指針中存儲的標記。損壞的標記可能會導致處理器無法檢測到內存安全違規,如下所示:

aadcd8be-7855-11ee-939d-92fbcf53809c.png

2023 年的擴展引入了專門用于指針操作的新指令。這些指令包含多種針對指針的檢查,包括檢查 bits[63:56] 是否被修改并防止溢出。使用 尋址模式的內存加載和存儲指令也可以配置為保留 bits[63:56]。

以前面的 MTE 為例,新功能讓處理器能夠檢測指針的前八位是否已被修改。這意味著,如果 MTE 標記損壞,則會向軟件發出報告。

其他功能

其他新引入的增強功能包括:

當生成或檢查指針驗證 (PAC) 碼時,支持組合使用程序計數器 (Program Counter, PC) 和當前選擇的堆棧指針 (Stack Pointer, SP) 作為修飾符。

支持啟用了機密領域管理擴展 (RME)[5] 的設計,可以在 Granule Protection Tables 中支持 non-secure only,也可以禁用某些物理地址空間 (PAS)。

EL3 配置寫入陷阱。

斷點支持地址范圍和 mismatch 觸發,而無需鏈接。

支持將 SError 從 EL3 高效委派給 EL2 或 EL1 處理。

在接下來的幾個月,Arm 將與合作伙伴一起努力,確保軟件生態系統能夠在未來處理器上市后盡快利用發揮這些功能的優勢。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    135

    文章

    9553

    瀏覽量

    391893
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301424
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265390
  • ARM架構
    +關注

    關注

    15

    文章

    185

    瀏覽量

    39210

原文標題:Arm A-Profile 架構 2023 擴展

文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    開發者正加速向Arm架構遷移

    Infrastructure (OCI) 及 NVIDIA 等超大規模云服務提供商與 AI 領軍企業,均已基于 Arm 架構打造定制化解決方案,布局 AI 數據中心。
    的頭像 發表于 02-02 15:10 ?430次閱讀

    深度解析?ARM?架構:從劍橋車庫到未來計算

    大家好,我是你們的技術博主[Linux1024]。 今天我們來聊聊一個無處不在,但又常常被忽略的技術基石——ARM架構。 當你拿起手機、平板,或是打開輕薄的筆記本,你手里的設備大概率就運行著ARM
    的頭像 發表于 01-05 07:09 ?372次閱讀
    深度解析?<b class='flag-5'>ARM</b>?<b class='flag-5'>架構</b>:從劍橋車庫到未來計算

    芯源MCU架構是不是基本都是ARM架構?還有其他的架構嗎?

    芯源MCU架構是不是基本都是ARM架構?還有其他的架構嗎?
    發表于 11-20 06:21

    常用 MCU 架構對比:ARM、AVR、PIC、RISC-V

    在嵌入式開發中,選擇合適的MCU架構往往決定了項目開發效率和最終產品性能。市面上MCU架構繁多,每種架構在指令集、性能、功耗、外設支持和生態
    的頭像 發表于 11-17 10:54 ?1669次閱讀
    常用 MCU <b class='flag-5'>架構</b>對比:<b class='flag-5'>ARM</b>、AVR、PIC、RISC-V

    FPGA+DSP/ARM架構開發與應用

    自中高端FPGA技術成熟以來,FPGA+DSP/ARM架構的硬件設計在眾多工業領域得到廣泛應用。例如無線通信、圖像處理、工業控制、儀器測量等。
    的頭像 發表于 10-15 10:39 ?4283次閱讀
    FPGA+DSP/<b class='flag-5'>ARM</b><b class='flag-5'>架構</b><b class='flag-5'>開發</b>與應用

    什么是ARM架構?你需要知道的一切

    從智能手機到工業邊緣計算機,ARM?架構為全球數十億臺設備提供動力。ARM?以其效率優先的設計和靈活的許可模式而聞名,已迅速從移動處理器擴展到人工智能邊緣計算、工業控制器,甚至數據中心。本文我們將
    的頭像 發表于 09-11 14:48 ?1294次閱讀
    什么是<b class='flag-5'>ARM</b><b class='flag-5'>架構</b>?你需要知道的一切

    一文了解Arm神經超級采樣 (Arm Neural Super Sampling, Arm NSS) 深入探索架構、訓練和推理

    本文將從訓練、網絡架構到后處理和推理等方面,深入探討 Arm 神經超級采樣 (Arm Neural Super Sampling, Arm NSS) 的工作原理,希望為機器學習 (ML
    的頭像 發表于 08-14 16:11 ?3043次閱讀

    Arm方案 基于Arm架構的邊緣側設備(樹莓派或 NVIDIA Jetson Nano)上部署PyTorch模型

    本文將為你展示如何在樹莓派或 NVIDIA Jetson Nano 等基于 Arm 架構的邊緣側設備上部署 PyTorch 模型。
    的頭像 發表于 07-28 11:50 ?2876次閱讀

    ARM入門學習方法分享

    的官方文檔,了解ARM架構的細節,并參考一些在線教程和博客來學習其他開發者的經驗和技巧。 總的來說,學習ARM需要一定的耐心和實踐。通過掌握基本概念、學習匯編語言、使用
    發表于 07-23 10:21

    一文回顧 Arm架構 40 年的創新歷程

    從 1980 年代為 BBC Micro 打造的低功耗 ARM1 處理器,到如今的人工智能 (AI) 設備,Arm 架構始終立于世界上最具變革性技術的核心。40 年來,Arm
    的頭像 發表于 07-09 18:41 ?2687次閱讀
    一文回顧 <b class='flag-5'>Arm</b><b class='flag-5'>架構</b> 40 年的創新歷程

    同一水平的 RISC-V 架構的 MCU,和 ARM 架構的 MCU 相比,運行速度如何?

    ARM 架構與 RISC-V 架構的 MCU 在同一性能水平下的運行速度對比,需從架構設計原點、指令集特性及實際測試數據展開剖析。以 ARM
    的頭像 發表于 07-02 10:29 ?1467次閱讀
    同一水平的 RISC-V <b class='flag-5'>架構</b>的 MCU,和 <b class='flag-5'>ARM</b> <b class='flag-5'>架構</b>的 MCU 相比,運行速度如何?

    Arm 公司面向移動端市場的 ?Arm Lumex? 深度解讀

    子系統(CSS)? ? 在移動端的落地形態,Lumex 旨在通過高度集成化的軟硬件方案,解決移動設備在 AI 性能、能效比與開發效率上的挑戰。以下從技術架構、性能突破、應用場景、生態系統及戰略價值展開分析: 一、技術架構:異構計
    的頭像 發表于 05-29 09:54 ?4381次閱讀

    Arm 公司面向汽車市場的 ?Arm Zena? 深度解讀

    汽車市場的落地形態,Zena 旨在解決汽車智能化轉型中的算力需求、開發效率與功能安全挑戰。以下從技術架構、性能優勢、應用場景、生態系統及戰略意義展開分析: 一、技術架構:異構集成與功能安全強化
    的頭像 發表于 05-29 09:51 ?2470次閱讀

    Arm架構何以成為現代計算的基礎

    2025 年 4 月,Arm 架構迎來了問世 40 周年。這個始于英國劍橋一隅、懷揣雄心壯志的項目,如今已成為全球廣泛采用的計算架構。從傳感器、智能手機、筆記本電腦,到汽車、數據中心等諸多領域,有數十億設備如今運行在
    的頭像 發表于 05-20 10:02 ?1197次閱讀

    Arm助力開發者加速遷移至Arm架構云平臺 Arm云遷移資源分享

    隨著基于 Arm 架構的云實例日益擴展,越來越多的用戶正從傳統平臺遷移至 Arm 平臺上。
    的頭像 發表于 04-09 18:23 ?1235次閱讀