国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用于處理器架構(gòu)探索的混合創(chuàng)新

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Deepak Shankar ? 2022-11-21 16:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

架構(gòu)探索一直是產(chǎn)品設(shè)計(jì)的圣杯。它有可能徹底改變產(chǎn)品工程。研究和用例評(píng)估表明,在架構(gòu)探索期間,可以實(shí)現(xiàn) 80% 的系統(tǒng)優(yōu)化和幾乎 100% 的性能/功耗權(quán)衡。

不幸的是,架構(gòu)探索未能起飛,除了在公司投入大量資源和時(shí)間的利基口袋。架構(gòu)探索一直被高度誤解,并且已經(jīng)推出了聲稱架構(gòu)探索的產(chǎn)品,但它們是現(xiàn)有產(chǎn)品(如指令集模擬器、軟件時(shí)序分析和硬件驗(yàn)證)的包裝器。使用一組類庫突出顯示語言不足以建立方法、輕松創(chuàng)建模型、根據(jù)基準(zhǔn)進(jìn)行驗(yàn)證以及性能系統(tǒng)優(yōu)化。

架構(gòu)探索的主要障礙是缺乏高端內(nèi)核、互連、緩存和存儲(chǔ)器的架構(gòu)模型。有限的模型范圍往往適用于架構(gòu)探索不會(huì)增加重要價(jià)值的低端處理器,周期精確的模型每秒最多運(yùn)行 1,000 條指令,需要很長(zhǎng)時(shí)間來安裝、學(xué)習(xí)和組裝,并且在 IP 交付后發(fā)布。這些模型需要數(shù)周時(shí)間才能運(yùn)行一個(gè)基準(zhǔn)測(cè)試,并且對(duì)于比較驗(yàn)證非常有用。此外,它們不能跨核心、SoC、系統(tǒng)和軟件進(jìn)行擴(kuò)展。

架構(gòu)模型對(duì)于 IP 提供商和 EDA 供應(yīng)商來說往往優(yōu)先級(jí)較低,因?yàn)樗麄儽仨毺峁?RTL 和軟件工具,如編譯器、調(diào)試器和驗(yàn)證 IP。此外,為大規(guī)模分發(fā)創(chuàng)建架構(gòu)模型需要特殊的技能,因?yàn)樵撨^程會(huì)針對(duì)每個(gè)核心類型重新開始。組裝需要很長(zhǎng)時(shí)間,需要多種資源,并且運(yùn)行速度極慢。每個(gè)新的處理器內(nèi)核都有如此多的變化 - 緩存的讀/寫寬度,多線程,ISA版本,可變管道階段,指令調(diào)度到執(zhí)行單元的調(diào)度邏輯和指令緩沖區(qū)。

具有隨機(jī)性的傳統(tǒng)架構(gòu)模型,被組裝大型系統(tǒng)和數(shù)據(jù)中心的公司使用。這些模型將模擬不同類型的請(qǐng)求和任務(wù)的延遲和功耗。

另一個(gè)主要問題是驗(yàn)證過程。對(duì)于新處理器,用于驗(yàn)證模型準(zhǔn)確性的基準(zhǔn)數(shù)據(jù)有限。對(duì)于功耗、緩存命中未命中率和內(nèi)存吞吐量,此問題更為嚴(yán)重。當(dāng)然,FPGA 板可以通過使用具有更新的緩存、互連和內(nèi)存設(shè)置的舊版本內(nèi)核來減輕部分負(fù)載。測(cè)試新內(nèi)核正確性的最佳方法是仔細(xì)檢查每個(gè)可能的方案,包括并發(fā)執(zhí)行,為緩存層次結(jié)構(gòu)和 DMA 運(yùn)行較舊的跟蹤,并生成確保絕對(duì)覆蓋的方案。

Mirabilis Design最近采取的一種方法是在具有圖形開發(fā)環(huán)境的離散事件模擬器上提供混合處理器架構(gòu)庫。這類架構(gòu)模型消除了早期方法的所有問題。這是一個(gè)常見的生成器,它使用電子表格來定義核心配置。內(nèi)部定序器通過消除不影響流程正確性、性能和功耗的邏輯來優(yōu)化仿真性能,并提供靈活的選項(xiàng)列表來定義不同的流水線變體。這種方法的優(yōu)點(diǎn)在于可以快速構(gòu)建新的甚至不存在的內(nèi)核。

這種方法具有多種好處,包括:

單個(gè)庫模塊可以將微控制器建模為高性能處理器。

處理器庫具有研究單個(gè)集群、多核集群組、片上系統(tǒng)和完整系統(tǒng)(如 ECU、雷達(dá)或超級(jí)計(jì)算機(jī))的仿真性能。

此方法提供了一個(gè)大型供應(yīng)商核心庫。

混合內(nèi)核與隨機(jī)內(nèi)核不同,具有運(yùn)行軟件跟蹤的能力。

擴(kuò)展庫具有所有連接和方法,使生成的內(nèi)核與緩存、動(dòng)態(tài)系統(tǒng)緩存、TileLink、AMBA AXI、NoC、DDR、LPDDR、GDDR、DMA 和網(wǎng)橋完全集成。

這些使用混合處理器的型號(hào)可用于選擇時(shí)鐘速度、緩沖區(qū)大小、寬度和容量,同時(shí)提供拓?fù)?、路由?a target="_blank">信號(hào)大小和設(shè)備連接。在電源方面,系統(tǒng)模型可以確定最佳電源狀態(tài)集和最佳電源管理算法。在這個(gè)早期階段分析功率可以深入了解配電、電池容量、充電系統(tǒng)和熱要求?;旌夏P偷臏?zhǔn)確性支持軟件性能調(diào)整以及調(diào)度程序和仲裁程序的選擇。

需要為性能生成所需的指標(biāo)包括延遲、吞吐量、緩沖區(qū)占用、命中率、管道停止、MIPS 和周期/指令。對(duì)平均和即時(shí)功率、能量耗散、每個(gè)任務(wù)和設(shè)備的功率以及能量管理算法的影響進(jìn)行真正的功率分析指標(biāo)。高級(jí)分析將涵蓋功能正確性、發(fā)生故障時(shí)的行為和服務(wù)質(zhì)量。

要在混合處理器中定義的屬性包括對(duì)執(zhí)行單元和延遲周期的 ISA 分配、浮點(diǎn)和整數(shù)單元數(shù)、每個(gè)群集的核心數(shù)、順序和無序的分布以及大/小內(nèi)核的數(shù)量。緩存配置可以涵蓋包含/排除、容量、關(guān)聯(lián)性、庫計(jì)數(shù)、暫存器的使用以及各種替換和寫入策略。對(duì)于互連,吞吐量要求、緩沖區(qū)占用、最有效的仲裁算法以及傳輸突發(fā)/閃爍大小。在內(nèi)存中,該模型可以測(cè)量帶寬、延遲和跟蹤、順序和隨機(jī)地址的打開/關(guān)閉頁。

在 SoC 級(jí)別,可以使用 DMA 與 TCP 傳輸、張量操作探索和拆分鎖定安排。必須測(cè)試系統(tǒng)是否跨集群的任務(wù)分區(qū)、內(nèi)存控制器調(diào)度、路由器數(shù)量和設(shè)備連接。隨著系統(tǒng)越來越接近客戶部署,可以擴(kuò)展相同的型號(hào)以集成多個(gè)處理器集成,最大限度地減少芯片到芯片的開銷,將應(yīng)用程序分發(fā)到處理器以及存儲(chǔ)策略。

架構(gòu)師可以從供應(yīng)商列表中進(jìn)行選擇,也可以在幾天內(nèi)創(chuàng)建一個(gè)新供應(yīng)商。一旦處理器內(nèi)核實(shí)例化,用戶可以連接其他半導(dǎo)體IP以形成完整的SoC。在短時(shí)間內(nèi),用戶可以擁有一個(gè)多核多集群、基于 NoC 的 SoC,其中包含 GPU、TPU/AI 加速器、存儲(chǔ)器、顯示器控制器、以太網(wǎng)和其他接口。為了仿真此模型,IO由泊松分布和數(shù)據(jù)范圍生成的數(shù)據(jù)流觸發(fā),處理器執(zhí)行軟件跟蹤以執(zhí)行仿真。多個(gè) SoC 可以通過相干的 PCIe 或 CXL 組合,也可以與高速以太網(wǎng)網(wǎng)絡(luò)或可靠的 OpenVPX 背板連接。

新的混合處理器對(duì)加載/存儲(chǔ)行為具有指令感知功能,按順序/無序執(zhí)行,支持多指令獲取和調(diào)度,支持每個(gè)管道階段的不同屬性,支持階段之間的流控制、任務(wù)問題的隊(duì)列、跳轉(zhuǎn)管道階段、管道和緩存之間的緩沖、可變讀寫寬度以及搶占支持?;旌戏椒梢詳U(kuò)展到 20 個(gè)執(zhí)行單元,類型分別為整數(shù)、浮點(diǎn)數(shù)、矢量、分支、加載和存儲(chǔ)。同時(shí),每個(gè)執(zhí)行單元的流水線級(jí)數(shù)可以可變,最多可以定義 20 個(gè)。

混合處理器的所有這些新功能都支持使用緩存地址執(zhí)行軟件跟蹤。為了準(zhǔn)備在此處理器型號(hào)上執(zhí)行的軟件,全自動(dòng)系統(tǒng)會(huì)生成用于負(fù)載存儲(chǔ)的指令序列、指令高速緩存地址和數(shù)據(jù)高速緩存地址。架構(gòu)模型與流量和軟件執(zhí)行的結(jié)合提供了一個(gè)有效的平臺(tái)來測(cè)試內(nèi)核、緩存、互連和內(nèi)存的準(zhǔn)確性。該測(cè)試涵蓋了端到端設(shè)計(jì)的延遲和功耗,還測(cè)量了緩存命中率和內(nèi)存吞吐量。這種新的基準(zhǔn)測(cè)試方法向用戶灌輸了信心,并確保了高質(zhì)量的權(quán)衡分析。

新的混合處理器可供使用 ARMRISC-V 內(nèi)核開發(fā)定制 SoC 的系統(tǒng)公司、集成多個(gè)非異構(gòu)主站、加速器、GPU 和其他處理單元的半導(dǎo)體公司以及實(shí)施新應(yīng)用程序和高級(jí) AI/ML 工作負(fù)載的 AI 公司使用。在所有市場(chǎng)中,系統(tǒng)和半導(dǎo)體的競(jìng)爭(zhēng)都非常激烈,新產(chǎn)品的時(shí)間表正在縮短。由于半導(dǎo)體短缺,公司必須更長(zhǎng)時(shí)間地使用現(xiàn)有的SoC,確定新的應(yīng)用,并支持現(xiàn)有設(shè)備上的更多功能。進(jìn)行廣泛的體系結(jié)構(gòu)覆蓋將提供實(shí)際性能和容量的詳細(xì)視圖,從而為將產(chǎn)品集成到其環(huán)境中的客戶提供有價(jià)值的見解。

混合處理器

的一個(gè)重要附帶好處是能夠運(yùn)行軟件并獲得目標(biāo)配置上軟件性能的準(zhǔn)確視圖。當(dāng)今的 SoC 配置非常復(fù)雜,在 FPGA 上運(yùn)行它會(huì)導(dǎo)致您錯(cuò)過一致性、數(shù)據(jù)分配、跨集群的工作負(fù)載分布以及數(shù)據(jù)路徑和緩存之間的復(fù)雜通信。軟件團(tuán)隊(duì)可及早了解在多核架構(gòu)上并發(fā)運(yùn)行一組軟件任務(wù)時(shí)的時(shí)序和功耗。

同樣,每個(gè)內(nèi)核都提供緩存層次結(jié)構(gòu)組織和與項(xiàng)目連接的變體,例如回寫、寬度、塊大小、預(yù)取條件、庫、關(guān)聯(lián)性、專用與系統(tǒng)等。然后是來自DDR,LPDDR,GDDR,HBM和商用內(nèi)存控制器中不同類型的調(diào)度程序的存儲(chǔ)器。最后,不同的互連選項(xiàng):特定于供應(yīng)商的片上網(wǎng)絡(luò)、極小的 NoC、AMBA 變體和 Tilelink。為此,添加 DMA、網(wǎng)橋、中斷、動(dòng)態(tài)共享緩存單元、IO、以太網(wǎng)、CAN/CAN-FD 和 PCIe 以獲得完整的要求。

混合處理器是電子設(shè)計(jì)行業(yè)的一項(xiàng)重大創(chuàng)新。它為架構(gòu)師提供了更多功能,并使團(tuán)隊(duì)能夠在開發(fā)之前可視化系統(tǒng)行為。由于分析速度很快,因此可以實(shí)現(xiàn)真正的架構(gòu)覆蓋,并且可以涵蓋性能、功耗、服務(wù)質(zhì)量、效率、可靠性和功能正確性。通過添加軟件性能分析和調(diào)優(yōu),所有系統(tǒng)團(tuán)隊(duì)都可以在同一環(huán)境中參與。隨著設(shè)計(jì)人員參與新應(yīng)用、小型工藝技術(shù)和不斷增長(zhǎng)的電源要求,混合處理器是未來的趨勢(shì)。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 微控制器
    +關(guān)注

    關(guān)注

    48

    文章

    8381

    瀏覽量

    164590
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20255

    瀏覽量

    252306
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1672

    瀏覽量

    51614
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    SMJ320C80數(shù)字信號(hào)處理器架構(gòu)、特性與應(yīng)用全解析

    SMJ320C80數(shù)字信號(hào)處理器架構(gòu)、特性與應(yīng)用全解析 在當(dāng)今數(shù)字化的時(shí)代,數(shù)字信號(hào)處理器(DSP)在眾多領(lǐng)域中發(fā)揮著至關(guān)重要的作用。SMJ320C80作為一款高性能的單芯片并行處理器
    的頭像 發(fā)表于 03-06 16:55 ?520次閱讀

    探索TDA54x Jacinto?處理器:高性能與安全的完美融合

    探索TDA54x Jacinto?處理器:高性能與安全的完美融合 在電子工程領(lǐng)域,處理器的性能和安全性一直是設(shè)計(jì)的關(guān)鍵考量因素。今天,我們來深入了解一下TDA54x Jacinto?處理器
    的頭像 發(fā)表于 03-06 16:50 ?497次閱讀

    TAS3103A數(shù)字音頻處理器:特性、架構(gòu)與應(yīng)用詳解

    TAS3103A數(shù)字音頻處理器:特性、架構(gòu)與應(yīng)用詳解 引言 在當(dāng)今數(shù)字化音頻處理領(lǐng)域,一款高性能、可配置的音頻處理器至關(guān)重要。德州儀器(Texas Instruments)的TAS31
    的頭像 發(fā)表于 02-27 16:25 ?114次閱讀

    探索DS1232 MicroMonitor芯片:微處理器的可靠守護(hù)者

    探索DS1232 MicroMonitor芯片:微處理器的可靠守護(hù)者 在電子工程師的日常設(shè)計(jì)工作中,保障微處理器穩(wěn)定運(yùn)行是至關(guān)重要的任務(wù)。DALLAS SEMICONDUCTOR(現(xiàn)MAXIM)推出
    的頭像 發(fā)表于 02-27 16:15 ?134次閱讀

    探索ADM6384:微處理器電源監(jiān)控的得力助手

    探索ADM6384:微處理器電源監(jiān)控的得力助手 在電子設(shè)計(jì)領(lǐng)域,微處理器系統(tǒng)的穩(wěn)定性和可靠性至關(guān)重要。而電源監(jiān)控電路則是保障系統(tǒng)穩(wěn)定運(yùn)行的關(guān)鍵環(huán)節(jié)之一。今天,我們就來深入了解一款高性能的微處理
    的頭像 發(fā)表于 02-27 10:55 ?125次閱讀

    Cortex-M0 處理器介紹

    Cortex-M0 處理器簡(jiǎn)介ARM公司的Cortex-M0應(yīng)用于各種微控制(MCU)中,并可讓研發(fā)工程師以8位的價(jià)位創(chuàng)造32位的的效能,并將傳統(tǒng)的8位和16位的處理器升級(jí)到更高效、
    發(fā)表于 01-16 08:04

    探索NXP i.MX 93應(yīng)用處理器家族:高效邊緣計(jì)算的理想之選

    探索NXP i.MX 93應(yīng)用處理器家族:高效邊緣計(jì)算的理想之選 在當(dāng)今的科技領(lǐng)域,邊緣計(jì)算正逐漸成為推動(dòng)各行業(yè)創(chuàng)新發(fā)展的關(guān)鍵力量。NXP的i.MX 93應(yīng)用處理器家族,憑借其卓越的性
    的頭像 發(fā)表于 12-24 14:50 ?577次閱讀

    探索i.MX 91應(yīng)用處理器家族:為邊緣應(yīng)用帶來新可能

    探索i.MX 91應(yīng)用處理器家族:為邊緣應(yīng)用帶來新可能 在當(dāng)今的物聯(lián)網(wǎng)和工業(yè)應(yīng)用領(lǐng)域,對(duì)高性能、安全且節(jié)能的處理器需求日益增長(zhǎng)。NXP的i.MX 91應(yīng)用處理器家族正是為滿足這些需求而
    的頭像 發(fā)表于 12-24 11:50 ?876次閱讀

    蜂鳥E203協(xié)處理器EAI指令及接口

    處理器擴(kuò)展,因此Custom指令也稱為EAI指令。 EAI指令編碼 32位的EAI指令編碼格式如下: 1)opcode段:使用RISC-V架構(gòu)中定義的Custom-1到4的指令組 2
    發(fā)表于 10-24 07:23

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+第二章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    1.1RISC-VISA 擴(kuò)展 1.2 向量協(xié)處理器 1.3 與各級(jí)存儲(chǔ)耦合的NPU 1.4 針對(duì)Transformer 模型的架構(gòu)優(yōu)化 SwiftTron是一款專用的開源AI加速用于
    發(fā)表于 09-12 17:30

    龍芯處理器支持WINDOWS嗎?

    龍芯處理器目前不支持原生運(yùn)行Windows操作系統(tǒng),主要原因如下: 架構(gòu)差異 龍芯架構(gòu):龍芯早期基于MIPS架構(gòu),后續(xù)轉(zhuǎn)向自主研發(fā)的LoongArch指令集(與x86/ARM不兼容
    發(fā)表于 06-05 14:24

    Analog Devices Inc. ADSP1802 SHARC?處理器數(shù)據(jù)手冊(cè)

    是32位/40位浮點(diǎn)處理器,優(yōu)化用于高性能音頻應(yīng)用。該器件具有大型片上RAM、多個(gè)消除I/O瓶頸的內(nèi)部總線以及創(chuàng)新的數(shù)字應(yīng)用接口(DAI)。
    的頭像 發(fā)表于 05-29 14:36 ?1428次閱讀
    Analog Devices Inc. ADSP1802 SHARC?<b class='flag-5'>處理器</b>數(shù)據(jù)手冊(cè)

    HPM5E31IGN單核 32 位 RISC-V 處理器

    處理器,憑借其卓越的性能和創(chuàng)新的設(shè)計(jì)理念,為工業(yè)控制、物聯(lián)網(wǎng)和消費(fèi)電子等領(lǐng)域提供了全新的解決方案。HPM5E31IGN采用精簡(jiǎn)指令集(RISC)設(shè)計(jì),指令集架構(gòu)完全開源,避免了傳統(tǒng)ARM架構(gòu)
    發(fā)表于 05-29 09:23

    技術(shù)分享 | 如何在2k0300(LoongArch架構(gòu)處理器上跑通qt開發(fā)流程

    技術(shù)分享 | 如何在2k0300開發(fā)板(LoongArch架構(gòu)處理器上跑通qt開發(fā)流程
    的頭像 發(fā)表于 05-20 11:05 ?898次閱讀
    技術(shù)分享 | 如何在2k0300(LoongArch<b class='flag-5'>架構(gòu)</b>)<b class='flag-5'>處理器</b>上跑通qt開發(fā)流程

    ADSP1802 SHARC處理器技術(shù)手冊(cè)

    ADSP1802 是一款數(shù)字信號(hào)處理器 (DSP),具有 Analog Devices, Inc. 超級(jí)哈佛架構(gòu)單芯片計(jì)算機(jī) (SHARC) 的 S PackageADSP1802 是一個(gè) 32 位
    的頭像 發(fā)表于 05-12 14:51 ?1552次閱讀
    ADSP1802 SHARC<b class='flag-5'>處理器</b>技術(shù)手冊(cè)