伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于Arm發布的V9架構詳細解析

安芯教育科技 ? 來源:半導體行業觀察 ? 作者:半導體行業觀察 ? 2021-04-09 16:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Arm在2011年10月首次發布Armv8架構以來,已經過去了近十年的時間。這對Arm來說是一個相當可觀的十年,因為在這段時間內,他們的指令集架構受到移動市場和服務器市場的高度關注,并鉚足勁在包括筆記本電腦和臺式機設備市場發力。過去多年里,Arm對ISA進行了改進,也對體系結構進行了各種更新和擴展。當中一些可能很重要,有些可能也是一瞥而過。

78dca9fe-94d0-11eb-8b86-12bb97331649.png

今天,作為Arm的Vision Day活動的一部分,該公司正式發布了該公司的新一代Armv9架構的首個細節,為Arm未來十年內成為下一個3000億芯片的計算平臺奠定了基礎。

78fd7896-94d0-11eb-8b86-12bb97331649.png

讀者可能會問的一個大問題是,Armv9與Armv8究竟有何不同,能讓架構獲得如此大的提升。確實,從純粹的ISA角度來看,v9可能不像v8相比v7那樣實現根本性的跳躍,后者引入了AArch64,一個完全不同的執行模式和指令集,該指令集與AArch32相比具有更大的微體系結構分支,例如擴展寄存器,64位虛擬地址空間和更多改進。

Armv9繼續使用AArch64作為基準指令集,但是在其功能上增加了一些非常重要的擴展,以保證architecture numbering的增加,并且允許Arm不僅可以獲得對AArch64進行某種軟件重新基準化v9的新功能,還能保持我們多年來在v8上獲得的擴展。

Arm認為新架構Armv9有三個主要支柱,即安全性、AI以及改進的矢量和DSP功能。對于v9,安全性是一個非常重要的主題,我們將深入探討新擴展和功能的新細節,但是首先談到的DSP和AI功能應該很簡單。

793a2d2c-94d0-11eb-8b86-12bb97331649.png

新的Armv9兼容CPU所承諾的最大的新功能可能是開發人員和用戶可以立即看到的——SVE2作為NEON的后繼產品。

可伸縮矢量擴展(SVE)的于2016年首次亮相,并首次在富士通的A64FX CPU內核中實現,該芯片已為日本排名第一的超級計算機Fukagu提供支持。SVE的問題在于,新的可變矢量長度SIMD指令集的第一次迭代的范圍相當有限,并且更多地針對HPC工作負載,缺少了許多仍由NEON涵蓋的更通用的指令。

SVE2于2019年4月發布,旨在通過用所需指令補充新的可擴展SIMD指令集來解決此問題,以服務于類似DSP等目前仍在使用NEON的工作負載。

除了增加的各種現代SIMD功能外,SVE和SVE2的優勢還在于其可變的向量大小,范圍覆蓋了128b到2048b,讓其無論在什么硬件運行,都允許向量的可變粒度為128b。如果純粹從向量處理和編程的角度來看,這意味著軟件開發人員將只需要編譯一次其代碼,并且如果將來某個CPU帶有本地的512b SIMD execution pipelines,該代碼將能夠充分利用單元的整個寬度。同樣,相同的代碼將能夠在具有較低硬件執行寬度能力的保守設計上運行,這對于Arm設計從物聯網、移動到數據中心的CPU而言至關重要。在保留Arm體系結構的32b編碼空間的同時,它還可以完成所有這些工作。然而類似X86這樣的架構則需要根據矢量尺寸增加新的指令和擴展。

7987990e-94d0-11eb-8b86-12bb97331649.png

機器學習也被視為Armv9的重要組成部分,因為Arm認為在未來幾年中,越來越多的ML工作負載將變得司空見慣,當中包括了對性能或電源效率有至關重要要求的場景中。那就讓在專用加速器上運行ML工作負載變成長久的需要,與此同時,我們還會繼續在CPU上運行較小范圍的ML工作負載。

矩陣乘法指令(Matrix multiplication instructions )是此處的關鍵,它將代表生態系統中將更大范圍采用v9 CPU作為基本功能所邁出的重要一步。

通常,我認為SVE2可能是保證升級到v9的最重要因素,因為它是更確定的ISA功能,可以在日常使用中與v8 CPU區別開來,并且可以保證軟件生態系統能夠正常運行,這與現有的v8堆棧有所不同。對于服務器領域的Arm來說,這實際上已經成為一個相當大的問題,因為軟件生態系統仍在基于v8.0的軟件包基礎上,不幸的是,該軟件包缺少了最重要的v8.1大型系統擴展。

使整個軟件生態系統向前發展,并假設新的v9硬件具有新的體系結構擴展功能,這將有助于推動事情發展,并可能解決某些當前情況。

但是,v9不僅涉及SVE2和新指令,它還非常注重安全性,在安全性方面我們將看到一些更根本的變化。

介紹機密的計算架構

在過去的幾年中,安全性和硬件安全性漏洞已成為芯片行業的頭等大事,Spectre,Meltdown等漏洞的出現及其所有同級邊信道攻擊都表明,重新思考如何保證安全成為了一個基本需求。Arm希望用來解決這一總體問題的方法是通過引入Arm機密計算體系結構(Arm Confidential Compute Architecture:CAA)來重新設計安全應用程序的工作方式。

在繼續之前,我想提箱一下,今天的披露僅僅是對新CCA運作方式的高層次解釋,Arm說,有關新安全機制的確切工作原理的更多細節將在今年夏天的晚些時候公布。

79ce651e-94d0-11eb-8b86-12bb97331649.png

7a174414-94d0-11eb-8b86-12bb97331649.png

CCA的目標是從當前的軟件堆棧情況中獲得更大的收益,在當前的軟件堆棧情況下,在設備上運行的應用程序必須固有地信任它們所運行的操作系統和虛擬機管理程序。傳統的安全模型是基于以下事實建立的:更高特權的軟件層被允許查看較低層的執行,然而當操作系統或系統管理程序被以任何方式損害時,這就可能成為了一個問題。

CCA引入了動態創建““realms”的新概念,可以將其視為對OS或虛擬機管理程序完全不透明的安全容器化執行環境。系統管理程序將仍然存在,但僅負責調度和資源分配。而“realm”將由稱為“ealm manager”的新實體管理,其被認為是一段新的代碼,大致大小約為hypervisor的1/10。

realm內的應用程序將能夠“證明”領域管理器以確定其是否可信任,這對于傳統的虛擬機管理程序而言是不可能的。

Arm并沒有深入探討究竟是什么造成了realm與操作系統和虛擬機管理程序的非安全世界之間的這種隔離,但聽起來確實像硬件支持的地址空間,但它們無法相互交互。

7a588f82-94d0-11eb-8b86-12bb97331649.png

7a804de2-94d0-11eb-8b86-12bb97331649.png

使用realms的優勢在于,它極大地減少了設備上運行的給定應用程序的信任鏈,并且OS對安全性問題變得越來越透明。與當今需要企業或企業使用帶有授權軟件堆棧的專用設備的情況相反,需要監督控制的關鍵任務應用程序將能夠在任何設備上運行。

7aac5a36-94d0-11eb-8b86-12bb97331649.png

7adeaca2-94d0-11eb-8b86-12bb97331649.png

MTE(memory tagging extensions)并不是v9的新功能,而是隨v8.5一起引入的,MTE或內存標記擴展旨在幫助解決世界軟件中兩個最持久的安全問題。緩沖區溢出(Buffers overflows)和無用后使用(use-after-free)是持續的軟件設計問題,在過去的50年中,這些問題一直是軟件設計的一部分,并且可能需要花費數年的時間才能對其進行識別或解決。MTE旨在通過在分配時標記指針并在使用時進行檢查來幫助識別此類問題。

未來的Arm CPU路線圖

這與v9沒有直接關系,但是與即將到來的v9設計的技術路線圖緊密相關,Arm還談到了有關他們在未來2年中對v9設計的預期性能的一些觀點。

7b0c21aa-94d0-11eb-8b86-12bb97331649.png

Arm談到了移動市場在今年如何將帶有X1的設備性能提升了2.4倍(此處我們僅指ISO流程設計的IPC),該性能是幾年前推出的Cortex-A73的兩倍。

有趣的是,Arm還談到了Neoverse V1設計及其如何達到A72類似設計性能的2.4倍,并透露他們期待著他今年晚些時候發布的首批V1設備。

對于代號為“ Matterhorn”和“ Makalu”的下一代移動IP內核,該公司公開了這兩代產品的合計預期IPC增益為30%,其中不包括SoC設計人員可以獲得的頻率或任何其他其他性能增益。這實際上代表著這兩種新設計的世代增加了14%,并且如幻燈片中的性能曲線所示,這表明相對于自A76以來Arm在過去幾年所管理的工作而言,改進的步伐正在放緩。不過,該公司指出,進步速度仍然遠遠超過行業平均水平。但潭門也坦言,這被一些行業參與者拖累了。

7b616426-94d0-11eb-8b86-12bb97331649.png

Arm還提供了一張很有意思的幻燈片,該幻燈片旨在關注系統側對性能的影響,而不僅僅是CPU IP性能。從這里提供的一些數據可以看到,例如每5ns的內存延遲中有1%的性能,這是我們現在已經廣泛討論了幾代的數字,但是Arm在這里還指出,排除了是否通過改善內存路徑,增加緩存或優化頻率功能來改善實現的其他各個方面,他們可以使用整整一代的CPU性能提升,我認為這是對SoC供應商當前保守方法的一種評價,這些方法沒有充分利用X1內核的預期性能余量,并且隨后也未達到新內核的預期性能預測。

7b890ef4-94d0-11eb-8b86-12bb97331649.png

Arm繼續將CPU視為未來最通用的計算模塊。盡管專用的加速器或GPU將會占有一席之地,但它們很難解決一些重要問題,例如可編程性,保護性,普遍性(本質上是在任何設備上運行它們的能力)以及經過驗證的正常工作的能力。當前,計算生態系統在運行方式上極為分散,不僅設備類型不同,而且設備供應商和操作系統也不同。

SVE2和Matrix乘法可以極大地簡化軟件生態系統,并允許計算工作負載以更統一的方法向前邁進,該方法將來將可以在任何設備上運行。

7bafee98-94d0-11eb-8b86-12bb97331649.png

最后,Arm還分享了有關Mali GPU未來的新信息,并透露該公司正在開發VRS等新技術,尤其是Ray Tracing。這一點令人非常令人驚訝,也表明AMD和Nvidia引入RT推動的臺式機和控制臺生態系統也有望將移動GPU生態系統推向RT。

Armv9設計即將在2022年初面世

今天的公告以一種非常高級的形式出現,我們希望Arm在接下來的幾個月中,在公司通常的年度技術披露中,更多地談論Armv9的各種細節和新功能,例如CCA。

總的來說,Armv9似乎是更基本的ISA轉變(可以看作SVE2)與軟件生態系統的總體重新基準的結合,以匯總v8擴展的最后十年,并為下一個十年奠定基礎Arm體系結構。

Arm于去年下半年已經談論過Neoverse V1和N2,我確實希望N2至少最終是基于v9而設計發布的。Arm進一步透露,更多基于Armv9的 CPU設計(可能是移動端Cortex-A78和X1的后續產品)將于今年推出,而新的CPU可能已經被通常的SoC供應商所采用,并且有望成為在2022年初在商用設備中出現。
編輯:lyn

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    135

    文章

    9573

    瀏覽量

    392889
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11305

    瀏覽量

    225510
  • AI
    AI
    +關注

    關注

    91

    文章

    40431

    瀏覽量

    302038

原文標題:前沿資訊 | Arm十年最大更新:V9架構正式發布

文章出處:【微信號:Ithingedu,微信公眾號:安芯教育科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Infineon XC2734X微控制器:16/32位架構的強勁之選

    Infineon XC2734X微控制器:16/32位架構的強勁之選 作為電子工程師,在設計過程中,選擇合適的微控制器至關重要。今天就來和大家聊聊英飛凌(Infineon)的XC2734X微控制器
    的頭像 發表于 03-30 16:35 ?19次閱讀

    RISC-V vs ARM:為什么工業與邊緣計算仍然選擇 ARM 架構

    在芯片架構討論中,RISC-VARM 的對比,已經從“技術選型”升級為“路線之爭”。 一邊是? RISC-V :開源、免授權、可定制、不受單一廠商控制;另一邊是?
    的頭像 發表于 01-21 17:33 ?847次閱讀
    RISC-<b class='flag-5'>V</b> vs <b class='flag-5'>ARM</b>:為什么工業與邊緣計算仍然選擇 <b class='flag-5'>ARM</b> <b class='flag-5'>架構</b>?

    深度解析?ARM?架構:從劍橋車庫到未來計算

    大家好,我是你們的技術博主[Linux1024]。 今天我們來聊聊一個無處不在,但又常常被忽略的技術基石——ARM架構。 當你拿起手機、平板,或是打開輕薄的筆記本,你手里的設備大概率就運行著ARM
    的頭像 發表于 01-05 07:09 ?431次閱讀
    深度<b class='flag-5'>解析</b>?<b class='flag-5'>ARM</b>?<b class='flag-5'>架構</b>:從劍橋車庫到未來計算

    TriBoard TC3X9:多功能評估板的詳細解析

    TriBoard TC3X9:多功能評估板的詳細解析 引言 在電子設計領域,一款功能強大且靈活的評估板對于開發者來說至關重要。TriBoard TC3X9 就是這樣一款值得關注的工具,
    的頭像 發表于 12-19 15:55 ?574次閱讀

    發布元服務設置上時間

    設置上時間 登錄AppGallery Connect,點擊“APP與元服務”。 選擇要發布的元服務。 左側導航選擇“應用上 > 版本信息”下待發布的版本。 進入
    發表于 12-03 09:46

    `lv_obj_tree.h` 在 **LVGL v9** 中的位置和作用

    lv_obj_tree.h 在 LVGL v9 中的位置和作用如下: 文件路徑 lv_obj_tree.h 位于 LVGL 源碼的 src/core/ 目錄下,完整路徑是: lvgl/src
    發表于 11-13 15:49

    元服務上自檢

    AppGallery Connect,點擊“APP與元服務”。 選擇要發布的元服務。 左側導航選擇“應用上 > 軟件包管理”,點擊軟件包“操作”列“啟動自檢”。 說明 每個元服務同時只能
    發表于 10-21 17:18

    基于蜂鳥E203架構的指令集K擴展

    向量操作指令,例如向量加法、向量乘法等。 在蜂鳥E203架構中,可以添加K擴展指令集,以處理大規模的數據集,可以添加以下指令: 1.VADD:向量加法指令,將兩個向量相加并存儲結果到一個向量寄存器中
    發表于 10-21 09:38

    福田汽車Tunland V9混動皮卡亮相2025意大利都靈車展

    近日,福田汽車旗下重磅產品Tunland V9全新混動皮卡在意大利都靈車展隆重亮相。歐洲作為全球汽車產業的發源地,對車輛性能、安全與環保標準的要求極為嚴苛,是檢驗產品實力的重要試金石。Tunland
    的頭像 發表于 10-17 14:21 ?642次閱讀

    迅為Hi3403V610開發板海思Cortex-A55架構核心板卡

    迅為電子重磅推出基于海思Hi3403處理器的高性能核心板,采用先進的四核Cortex-A55架構,主頻高達1.4GHz,以強勁算力、超凡能效比與卓越的圖像處理能力,為千行百業的智能化升級注入核心動力。無論是智能視覺、工業互聯,還是AIoT邊緣計算,它都能輕松駕馭,助您暢快開發!
    的頭像 發表于 09-30 14:18 ?776次閱讀
    迅為Hi3403<b class='flag-5'>V</b>610開發板海思Cortex-A55<b class='flag-5'>架構</b>核心板卡

    同一水平的 RISC-V 架構的 MCU,和 ARM 架構的 MCU 相比,運行速度如何?

    ARM 架構與 RISC-V 架構的 MCU 在同一性能水平下的運行速度對比,需從架構設計原點、指令集特性及實際測試數據展開剖析。以
    的頭像 發表于 07-02 10:29 ?1598次閱讀
    同一水平的 RISC-<b class='flag-5'>V</b> <b class='flag-5'>架構</b>的 MCU,和 <b class='flag-5'>ARM</b> <b class='flag-5'>架構</b>的 MCU 相比,運行速度如何?

    RISC-V架構CPU的RAS解決方案

    RISC-V架構以追趕者的姿態在多個應用領域與X86架構ARM架構展開競爭。在服務器應用領域,RISC-
    的頭像 發表于 06-06 17:03 ?1898次閱讀
    RISC-<b class='flag-5'>V</b><b class='flag-5'>架構</b>CPU的RAS解決方案

    ARM服務器解決方案

    可控制在15W以下,較x86架構能效比提升50%以上,尤其適合邊緣計算和輕量級并發場景。 彈性擴展能力? 模塊化設計支持通過增減處理器節點快速調整算力,硬件成本較x86架構低30%-40%,結合容器化技術實現動態資源調配。 異構計算集成? ARMv
    的頭像 發表于 05-16 07:44 ?1198次閱讀
    <b class='flag-5'>ARM</b>服務器解決方案

    Qualcomm QCS8250芯片的全面解析

    景。 核心架構與工藝 制程工藝 :采用7nm FFP(FinFET Plus)工藝,平衡性能與功耗。 CPU :八核Kryo 585架構(4×2.85GHz高性能核心 + 4×1.8GHz能效核心),兼容Arm
    的頭像 發表于 04-08 16:44 ?4563次閱讀
    Qualcomm QCS8250芯片的全面<b class='flag-5'>解析</b>

    如何在Linux內核5.18版本之后和64位架構中從內核空間調用ioctl?

    我嘗試在最近的內核中重新構建以前版本 (4.19) 的 Linux 設備驅動程序,即嵌入式平臺上的 6.1.22,ARM64 架構。 驅動程序管理 tty 設備。 當我調用類似于用戶空間
    發表于 04-02 06:06