国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

處理器架構探索的混合創新

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Deepak Shankar ? 2022-06-01 15:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

架構探索一直是產品設計的圣杯。它有可能徹底改變產品工程。研究和用例評估表明,在架構探索期間可以實現 80% 的系統優化和幾乎 100% 的性能/功耗權衡。

不幸的是,除了公司投入大量資源和時間的利基領域外,架構探索未能起飛。架構探索被高度誤解,并且已經推出了聲稱架構探索但圍繞現有產品(例如指令集模擬器、軟件時序分析器和硬件驗證)的產品。用一組類庫突出顯示語言不足以建立方法、輕松創建模型、針對基準進行驗證和性能系統優化。

架構探索的主要障礙是缺乏高端內核、互連、緩存和內存的架構模型。有限的模型范圍往往適用于架構探索不會增加顯著價值的低端處理器,每秒運行最多 1,000 條指令的周期精確模型,需要很長時間來安裝、學習和組裝,并在 IP 發貨后很好地發布。這些模型需要數周時間才能運行一個基準測試,并且對于比較驗證很有用。此外,它們不能跨內核、SoC、系統和軟件進行擴展。

架構模型往往是 IP 提供商和 EDA 供應商的低優先級,因為他們必須提供 RTL 和軟件工具,例如編譯器、調試器和驗證 IP。此外,為大規模分發創建架構模型需要特殊的技能,因為每個核心類型的流程都重新開始。組裝需要很長時間,需要多種資源,并且運行速度極慢。每個新的處理器內核都有很多變化——緩存的讀/寫寬度、多線程、ISA 版本、可變流水線階段、用于將指令分派到執行單元的調度邏輯以及指令緩沖區。

具有隨機性的傳統架構模型被組裝大型系統和數據中心的公司使用。這些模型將模擬不同類型的請求和任務的延遲和功耗。

另一個主要問題是驗證過程。對于新處理器,用于驗證模型準確性的基準數據有限。這個問題對于功耗、高速緩存命中未命中率和內存吞吐量而言更為嚴重。當然,FPGA 板可以通過使用舊版本的內核以及更新的緩存、互連和內存設置來減輕一些負載。測試新內核正確性的最佳方法是仔細檢查每個可能的場景,包括并發執行,運行緩存層次結構和 DMA 的舊跟蹤,并生成確保絕對覆蓋的場景。

pYYBAGKXG02ALVAEAAIK9vGmGXM292.png

圖 1:基于 RISC-VARM 的 VisualSim 處理器架構探索

Mirabilis Design 最近采用的一種方法是在具有圖形開發環境的離散事件模擬器上提供混合處理器架構庫。這類架構模型消除了早期方法的所有問題。這是一個通用的生成器,它使用電子表格來定義核心配置。內部定序器通過消除不影響流正確性、性能和功率的邏輯來優化仿真性能,并提供靈活的選項列表來定義不同的管道變體。這種方法的美妙之處在于可以快速構建新的甚至不存在的內核。

這種方法有多種好處,包括:

單個庫模塊可以將微控制器建模為高性能處理器。

處理器庫具有研究單個集群、多核集群組、片上系統和完整系統(如 ECU、雷達或超級計算機)的仿真性能。

這種方法提供了一個龐大的供應商內核庫。

混合核心與隨機核心不同,具有運行軟件跟蹤的能力。

擴展庫具有使生成的內核與緩存、動態系統緩存、TileLink、AMBA AXI、NoC、DDR、LPDDR、GDDR、DMA 和橋完全集成的所有連接性和方法。

這些使用混合處理器的模型可用于選擇時鐘速度、緩沖區大小、寬度和容量,同時提供拓撲、路由、flit 大小和設備連接性。在電源方面,系統模型可以確定最佳電源狀態集和最佳電源管理算法。在這個早期階段分析功率可以深入了解配電、電池容量、充電系統和熱要求。混合模型的準確性使軟件性能調整和調度器和仲裁器的選擇成為可能。

需要為性能生成的所需指標是延遲、吞吐量、緩沖區占用率、命中率、流水線停頓、MIPS 和周期/指令。對平均和瞬時功率、能耗、每個任務和設備的功率以及能源管理算法的影響進行真正的功率分析指標。高級分析將涵蓋功能正確性、發生故障時的行為和服務質量。

要在混合處理器中定義的屬性包括對執行單元和延遲周期的 ISA 分配、浮點和整數單元的數量、每個集群的核心數、有序和無序的分布以及大/小數量核心。緩存配置可以涵蓋包含/排除、容量、關聯性、銀行計數、暫存器的使用以及各種替換和寫入策略。對于互連,吞吐量要求、緩沖區占用率、最有效的仲裁算法以及傳輸突發/閃存大小。在內存中,該模型可以測量跟蹤、順序和隨機地址的帶寬、延遲和打開/關閉頁面。

在 SoC 級別,使用了 DMA 與 TCP 傳輸、張量操作探索和拆分鎖安排。必須對系統進行跨集群的任務分區、內存控制器調度、路由器數量和設備連接性測試。隨著系統越來越接近客戶部署,可以擴展相同的模型以集成多處理器集成,最大限度地減少芯片到芯片的開銷,將應用程序分配到處理器以及存儲策略。

架構師可以從供應商列表中選擇或在幾天內創建一個新的。一旦處理器內核被實例化,用戶就可以連接其他半導體 IP 以形成完整的 SoC。在短時間內,用戶可以擁有一個多核多集群、基于 NoC 的 SoC,帶有 GPU、TPU/AI 加速器、內存、顯示控制器、以太網和其他接口。為了模擬這個模型,IO 由泊松分布和數據范圍生成的數據流觸發,處理器執行軟件跟蹤以執行模擬。多個 SoC 可以通過連貫的 PCIe 或 CXL 組合,或與高速以太網或可靠的 OpenVPX 背板連接。

pYYBAGKXG1WAJS_mAAUrnpGHvbQ503.png

圖 2:具有高速緩存存儲器層次結構的亂序處理器管道的系統級模型

新的混合處理器對加載/存儲行為具有指令感知,按順序/無序執行,支持多指令獲取和分派,支持每個流水線階段的不同屬性,支持之間的流控制階段、任務發布隊列、跳轉流水線階段、流水線和緩存之間的緩沖、可變讀寫寬度和搶占支持。混合方法可以擴展到 20 個整數、浮點、向量、分支、加載和存儲類型的執行單元。同時,每個執行單元的流水線級數可以是可變的,最多可以定義為 20 個。

混合處理器的所有這些新功能都支持帶有緩存地址的執行軟件跟蹤。為了準備在此處理器模型上執行的軟件,全自動系統會生成指令序列、指令高速緩存地址和數據高速緩存地址以用于加載存儲。架構模型與流量和軟件執行的結合提供了一個有效的平臺來測試內核、緩存、互連和內存的準確性。該測試涵蓋了端到端設計的延遲和功耗,還測量了緩存命中率和內存吞吐量。這種新的基準測試方法可以增強用戶的信心,并確保進行高質量的權衡分析。

新的混合處理器可供使用 ARM 或 RISC-V 內核開發定制 SoC 的系統公司、集成多個非異構主設備、加速器、GPU 和其他處理單元的半導體公司,以及實施新應用程序和高級 AI/ML 工作負載的 AI 公司使用。 系統和半導體的競爭在所有市場上都很重要,新產品的時間安排正在縮短。由于半導體短缺,公司必須更長時間地使用現有 SoC,識別新應用并支持現有設備上增加的功能。進行廣泛的架構覆蓋將提供對實際性能和容量的詳細視圖,從而為將產品集成到其環境中的客戶提供有價值的見解。

poYBAGKXG2CAZQ2tAAID4cFtaow949.png

圖 3:具有 Aaa65AE 的多集群多核處理器,用于汽車安全關鍵型應用

混合處理器的一個重要附帶好處是能夠運行軟件并準確查看目標配置上的軟件性能。當今的 SoC 配置非常復雜,以至于在 FPGA 上運行它會導致您錯過一致性、數據分配、跨集群的工作負載分配以及數據路徑和緩存之間復雜的通信。當一組軟件任務在多核架構上同時運行時,軟件團隊可以及早了解時序和功耗。

類似地,每個內核都提供了緩存層次結構的變化以及與諸如回寫、寬度、塊大小、預取條件、存儲體、關聯性、私有與系統等項目的連接。然后是來自DDR、LPDDR、GDDR、HBM的內存,以及商業內存控制器中不同類型的調度器。最后,不同的互連選項:供應商特定的片上網絡、極小的 NoC、AMBA 變體和 Tilelink。為此添加 DMA、網橋、中斷、動態共享緩存單元、IO、以太網、CAN/CAN-FD 和 PCIe 以獲得完整的要求。

混合處理器是電子設計行業的一項重大創新。它為架構師提供了更多的權力,并使團隊能夠在開發之前可視化系統行為。由于分析速度很快,真正的架構覆蓋是可能的,并且可以涵蓋性能、功率、服務質量、效率、可靠性和功能正確性。通過添加軟件性能分析和調整,所有系統團隊都可以在同一環境中參與。隨著設計人員參與新應用、小型工藝技術和不斷增加的功率要求,混合處理器是未來。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20255

    瀏覽量

    252299
  • 以太網
    +關注

    關注

    41

    文章

    5998

    瀏覽量

    180848
  • soc
    soc
    +關注

    關注

    40

    文章

    4576

    瀏覽量

    229145
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    SMJ320C80數字信號處理器架構、特性與應用全解析

    SMJ320C80數字信號處理器架構、特性與應用全解析 在當今數字化的時代,數字信號處理器(DSP)在眾多領域中發揮著至關重要的作用。SMJ320C80作為一款高性能的單芯片并行處理器
    的頭像 發表于 03-06 16:55 ?502次閱讀

    探索TDA54x Jacinto?處理器:高性能與安全的完美融合

    探索TDA54x Jacinto?處理器:高性能與安全的完美融合 在電子工程領域,處理器的性能和安全性一直是設計的關鍵考量因素。今天,我們來深入了解一下TDA54x Jacinto?處理器
    的頭像 發表于 03-06 16:50 ?483次閱讀

    TAS3103A數字音頻處理器:特性、架構與應用詳解

    TAS3103A數字音頻處理器:特性、架構與應用詳解 引言 在當今數字化音頻處理領域,一款高性能、可配置的音頻處理器至關重要。德州儀器(Texas Instruments)的TAS31
    的頭像 發表于 02-27 16:25 ?113次閱讀

    探索DS1232 MicroMonitor芯片:微處理器的可靠守護者

    探索DS1232 MicroMonitor芯片:微處理器的可靠守護者 在電子工程師的日常設計工作中,保障微處理器穩定運行是至關重要的任務。DALLAS SEMICONDUCTOR(現MAXIM)推出
    的頭像 發表于 02-27 16:15 ?132次閱讀

    探索ADM6384:微處理器電源監控的得力助手

    探索ADM6384:微處理器電源監控的得力助手 在電子設計領域,微處理器系統的穩定性和可靠性至關重要。而電源監控電路則是保障系統穩定運行的關鍵環節之一。今天,我們就來深入了解一款高性能的微處理
    的頭像 發表于 02-27 10:55 ?125次閱讀

    Cortex-M0 處理器介紹

    功耗的32位處理器。 Cortex-M0是Cortex-M家族中的M0系列。最大特點是低功耗的設計。Cortex-M0為32位、3級流水線RISC處理器,其核心仍為馮.諾依曼結構,是指令和數據共享同一總線的架構
    發表于 01-16 08:04

    探索NXP i.MX 93應用處理器家族:高效邊緣計算的理想之選

    探索NXP i.MX 93應用處理器家族:高效邊緣計算的理想之選 在當今的科技領域,邊緣計算正逐漸成為推動各行業創新發展的關鍵力量。NXP的i.MX 93應用處理器家族,憑借其卓越的性
    的頭像 發表于 12-24 14:50 ?576次閱讀

    探索i.MX 91應用處理器家族:為邊緣應用帶來新可能

    探索i.MX 91應用處理器家族:為邊緣應用帶來新可能 在當今的物聯網和工業應用領域,對高性能、安全且節能的處理器需求日益增長。NXP的i.MX 91應用處理器家族正是為滿足這些需求而
    的頭像 發表于 12-24 11:50 ?870次閱讀

    瑞芯微SOC智能視覺AI處理器

    RK3568B2: 一款性能均衡、接口豐富的中高端AIoT應用處理器,是RK3568的優化版本,主打穩定與可靠性。CPU/GPU: 延續RK3568的4核A55 + G52 GPU架構,性能可靠
    發表于 12-19 13:44

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現深度學習AI芯片的創新方法與架構

    1.1RISC-VISA 擴展 1.2 向量協處理器 1.3 與各級存儲耦合的NPU 1.4 針對Transformer 模型的架構優化 SwiftTron是一款專用的開源AI加速,用于量化
    發表于 09-12 17:30

    【「DeepSeek 核心技術揭秘」閱讀體驗】第三章:探索 DeepSeek - V3 技術架構的奧秘

    存在資源利用率不高的問題,但它是基礎探索,讓 我看到將模型分段處理以實現流水線作業的初步嘗試。 而 GPipe 方法的改進,通過微批次處理減少并行氣泡,如同給流水線 “疏通血管”,讓計算設備的閑置
    發表于 07-20 15:07

    龍芯處理器支持WINDOWS嗎?

    龍芯處理器目前不支持原生運行Windows操作系統,主要原因如下: 架構差異 龍芯架構:龍芯早期基于MIPS架構,后續轉向自主研發的LoongArch指令集(與x86/ARM不兼容
    發表于 06-05 14:24

    Analog Devices Inc. ADSP1802 SHARC?處理器數據手冊

    Analog Devices ADSP1802 SHARC^?^ 處理器是采用ADI Super Harvard架構單芯片計算機(SHARC)的數字信號處理器(DSP)。ADSP1802 DSP
    的頭像 發表于 05-29 14:36 ?1427次閱讀
    Analog Devices Inc. ADSP1802 SHARC?<b class='flag-5'>處理器</b>數據手冊

    技術分享 | 如何在2k0300(LoongArch架構處理器上跑通qt開發流程

    技術分享 | 如何在2k0300開發板(LoongArch架構處理器上跑通qt開發流程
    的頭像 發表于 05-20 11:05 ?897次閱讀
    技術分享 | 如何在2k0300(LoongArch<b class='flag-5'>架構</b>)<b class='flag-5'>處理器</b>上跑通qt開發流程

    ADSP1802 SHARC處理器技術手冊

    ADSP1802 是一款數字信號處理器 (DSP),具有 Analog Devices, Inc. 超級哈佛架構單芯片計算機 (SHARC) 的 S PackageADSP1802 是一個 32 位
    的頭像 發表于 05-12 14:51 ?1551次閱讀
    ADSP1802 SHARC<b class='flag-5'>處理器</b>技術手冊