国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DSP處理器上并行實現ATR算法

454398 ? 來源:羅姆半導體社區 ? 作者:羅姆半導體社區 ? 2022-12-20 18:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:羅姆半導體社區

自動目標識別(ATR)算法通常包括自動地對目標進行檢測、跟蹤、識別和選擇攻擊點等算法。戰場環境的復雜性和目標類型的不斷增長使ATR算法的運算量越來越大,因此ATR算法對微處理器的處理能力提出了更高的要求。由于通用數字信號處理芯片能夠通過編程實現各種復雜的運算,處理精度高,具有較大的靈活性,而且尺寸小、功耗低、速度快,所以一般選擇DSP芯片作為微處理器來實現ATR算法的工程化和實用化。

為了保證在DSP處理器上實時地實現ATR算法,用算法并行化技術。算法并行化處理的三要素是:①并行體系結構;②并行軟件系統;③并行算法。并行體系結構是算法并行化的硬件基礎,并行算法都是針對特定的并行體系結構開發的并行程序。根據DSP處理器的數目,ATR算法的并行實現可以分為處理器間并行和處理器內并行。處理器間并行是指多個DSP處理器以某種方式連接起來的多處理器并行系統,ATR算法在多個處理器上并行招待。

根據處理器使用存儲器的情況,多處理器并行系統又可分為共享存儲器多處理器并行系統和分布式多處理器并行系統。處理器內并行是指在單個DSP處理器內通過多個功能單元的指令級并行(ILP)來實現ATR算法的并行化。本文分別對在共享存儲器多處理器并行系統、分布式多處理器并行系統和指令級并行DSP處理器上并行實現ATR算法進行了探討。

1 在共享存儲器多處理并行系統上實現ATR算法

在共享存儲器多處理器并行系統中,各個處理器通過共享總線對所有的存儲器進行操作,實現各個處理器之間的數據通信。而在任一時刻,只允許一個處理器對共享總線進行操作。所以處理器對存儲器進行讀/寫操作時就必須先獲得對共享總線的控制權,這通過總線仲裁電路實現。然而,由于所有的處理器只能通過一條共享總線對存儲器進行訪問,這在處理器數目比較多或者處理器之間頻繁交換數據的情況下容易引起總線沖突和等待而降低整個并行系統的運行速度。共享存儲器多處理器并行系統的優點是結構簡單,當處理器的數目較少時,可以達到較高的加速比。 ADSP2106x處理器支持最為常用的共享存儲器多處理器并行系統,組成多處理器系統的每一片ADSP2106x的片內存儲器統一編址,任一ADSP2106x可以訪問其它任何一片ADSP2106x的片內存儲器。由于片內SRAM為雙口存儲器,因而這種訪問并不中斷被訪問處理器的正常工作。每個處理器片內SRAM既是該處理器的局部存儲器,又是共享存儲器的部分。在不增加輔助電容的情況下,通過外部總線接口直接相連的處理器數量最多為6個。由于每個處理器的工作程序放在其片內的雙口SRAM中,因此各個處理器可以實現并行處理,這是ADSP2106x的存儲器結構所決定的。 ATR算法在共享存儲器多處理器并行系統中實現時,在編寫并行算法程序方面應當重點考慮的問題包括: (1)均衡地把任務分配給各個處理器 ATR算法在共享存儲器多處理器并行系統中實現任務級并行,因此必須把ATR算法劃分為計算量均衡的多個任務,把各個任務分配給多個處理器,才能發揮多處理器并行系統的最大并行效率。 (2)盡量減少多處理器之間數據通信 由于多處理器只能通過一條共享總線對存儲器進行訪問,這在多處理器之間頻繁交換數據的情況下容易引起總線競爭而降低整個并行系統的運行速度。 (3)利用單個處理器的并行編程特性 充分應用單個處理器的并行編程特性,有利于縮短各個處理器上任務的運行時間。例如,ADSP2106x的32位浮點運算單元包含一個乘法器、一個加法器和移位邏輯電路,它們并行工作;比特倒轉尋址在傅立葉變換運算時非常有用;循環尋址在作卷積、數字濾波運算時經常用到等。

2 在分布式多處理器并行系統上實現ATR算法

在分布式多處理器并行系統中,多處理器有各自獨立的存儲器,多個處理器通過通信口相連構成分布式多處理器并行系統。分布式多處理器并行系統的加速比和處理器的數目呈線性關系,所以只要增加處理器的數目,分布式多處理器并行系統的處理能力就能夠成比例地增加。分布式多處理器比較適合于構成大規模并行系統。

目前,計算量過大仍然是制約許多有效的ATR算法實時實現的個主要因素。ATR算法在分布式多處理器并行系統上實時實現是一個很有潛力的研究領域,特別在地基和天基雷達信號處理系統中有廣闊的應用前景。分布式多處理器并行系統的連接方式有線形、樹形、星形、網孔和超立方體結構等。樹形和星形網絡的優點是網絡管理容易、數據通信進尋徑簡單;缺點是樹形網絡的根節點處理器和星形網絡的中央節點處理器的輸入/輸出吞吐量大,易造成通信瓶頸。所以樹形和星形網絡不適合ATR算法各個任務數據通信量較大的應用場合。

在分布式多處理器并行系統中并行實現ATR算法目前還處于研究的初始階段,在編寫并行算法程序應當重點考慮兩個方面: (1)各處理器任務的均衡分配 在分布式多處理器并行系統中處理器的數目通常較多,只有合理地對眾多的處理器均衡地分配任務,才能最大地發揮并行系統的總體性能,提高并行系統的加速比。 (2)處理器節點間的高效通信 在分布式多處理器并行系統中數據通信都是點對點通信。即兩個相鄰的處理器之間通過通信口通信。因此需要合理安排各個處理器節點在網絡結構中的位置,盡可能地縮短處理器節點間的通信路徑長度,從而實現處理器節點間的高效數據通信。

3 在指令級并行DSP處理器上實現ATR算法

在單片DSP處理器內通過多個功能單元的指令級并行(ILP)實現ATR算法的并行化處理,目前適合ATR算法實時處理的指令級并行芯片是TI公司的TMS320C6x系列DSP。TMS320C6x系列DSP處理器是第一個使用超長指令字(VLIW)體系結構的數字信號處理芯片。下面以TMS320C62x定點系列DSP為例說明指令級并行的原理和ATR并行算法軟件開發方法。內核中的8個功能單元可以完全并行運行,功能單元執行邏輯、位移、乘法、加法和數據尋址等操作。內核采用VLIW體系結構,單指令字長32位,取指令、指令分配和指令譯碼單元每周期可以從程序存儲器傳遞8條指令到功能單元。這8條指令組成一個指令包,總字長為256位。芯片內部設置了專門的指令分配模塊,可以將每個256位的指令分配到8個功能單元中,并由8個功能單元并行運行。TMS320C62x芯片的最高時鐘頻率可以達到200MHz。當8個功能單元同時運行時,該芯片的處理能力高達1600MIPS。

審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20255

    瀏覽量

    252306
  • dsp
    dsp
    +關注

    關注

    561

    文章

    8244

    瀏覽量

    366655
  • atr
    atr
    +關注

    關注

    0

    文章

    2

    瀏覽量

    1390
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    SMJ320C80數字信號處理器:架構、特性與應用全解析

    SMJ320C80數字信號處理器:架構、特性與應用全解析 在當今數字化的時代,數字信號處理器DSP)在眾多領域中發揮著至關重要的作用。SMJ320C80作為一款高性能的單芯片并行
    的頭像 發表于 03-06 16:55 ?521次閱讀

    HXS320F280049C數字信號處理器DSP)芯片

    HXS320F280049C數字信號處理器DSP)芯片HXS320F280049C是中科昊芯(Haawking)自主研發的32位浮點數字信號處理器(DSC),其核心搭載自主設計的H28x
    發表于 01-22 09:04

    Ceva在恩智浦的軟件定義車輛處理器實現 實時人工智能加速

    恩智浦 * S32Z2 和 S32E2 實時處理器集成 Ceva**的* * AI DSP* ,為軟件定義車輛提供預測分析、能量管理和智能控制功能 隨著車輛向軟件定義平臺演進,對實時處理、安全性
    的頭像 發表于 01-09 11:14 ?526次閱讀
    Ceva在恩智浦的軟件定義車輛<b class='flag-5'>處理器</b><b class='flag-5'>上</b><b class='flag-5'>實現</b> 實時人工智能加速

    利用Verdi調試協處理器實現步驟

    本次給大家介紹的是利用Verdi調試協處理器實現步驟。 有時為了觀察協處理器運行情況,需要查看協處理器接口的信號波形,此時可以用Verdi來查看主
    發表于 10-30 08:26

    MD5信息摘要算法實現二(基于蜂鳥E203協處理器

    本設計首先根據MD5協處理器的功能設計MD5算法IP核,軟件部分使用串口程序助手進行64位加解密結果的輸出,E203內核根據地址取出對應的數據,使用相關的指令進行傳輸顯示。通過NICE接口將MD5協
    發表于 10-30 07:54

    Camellia算法實現(基于開源蜂鳥E203協處理器

    項目構想 我們一開始就選擇信息安全作為芯來杯比賽方向,并以Camellia算法作為算法原型。借助蜂鳥E203的協處理,能加速Camellia算法的運算,并通過比較軟件
    發表于 10-30 07:04

    Camellia算法實現二(基于開源蜂鳥E203協處理器

    一篇分享文檔介紹了Camellia算法的基本原理,這一篇文檔我們來介紹Camellia的具體實現方式。 如上圖所示為Camellia加解密系統的結構,PC端上位機通過串口以
    發表于 10-30 06:35

    AES加解密算法邏輯實現及其在蜂鳥E203SoC的應用介紹

    這次分享我們會簡要介紹AES加解密算法的邏輯實現,以及如何將AES算法做成硬件協處理器集成在蜂鳥E203 SoC。 AES
    發表于 10-29 07:29

    基于E203 RISC-V的音頻信號處理系統 -協處理器的乘累加過程

    進行卷積加速,對一行數據進行操縱,后接累加進行卷積結果累加得到運算結果。 利用乘積累加運算特性,規定相關協處理器的自定義指令。然后對指令進行乘積累加運算電路模塊化。從而快速的實現乘積累加的功能
    發表于 10-28 06:18

    Analog Devices Inc. ADSP1802 SHARC?處理器數據手冊

    Analog Devices ADSP1802 SHARC^?^ 處理器是采用ADI Super Harvard架構單芯片計算機(SHARC)的數字信號處理器(DSP)。ADSP1802 DS
    的頭像 發表于 05-29 14:36 ?1428次閱讀
    Analog Devices Inc. ADSP1802 SHARC?<b class='flag-5'>處理器</b>數據手冊

    HXS320F28027數字信號處理器(32位RISC-V DSP

    HXS320F28027數字信號處理器(32位RISC-V DSP)HXS320F28027是中科昊芯(Haawking)基于自主研發的H28x內核推出的32位定點RISC-V DSP架構數字信號
    發表于 05-21 10:21

    ADAU1463/ADAU1467 具有擴展內部存儲和 I/O功能的Sigma DSP數字音頻處理器技術手冊

    ^?^ 圖形編程工具,可以產生互動式、直觀和功能強大的信號處理流。與前幾代SigmaDSP所需的指令相比,增強型數字信號處理器(DSP)內核架構能以大幅精簡的指令執行某類音頻處理算法
    的頭像 發表于 05-12 15:06 ?1485次閱讀
    ADAU1463/ADAU1467 具有擴展內部存儲<b class='flag-5'>器</b>和 I/O功能的Sigma <b class='flag-5'>DSP</b>數字音頻<b class='flag-5'>處理器</b>技術手冊

    ADSP1802 SHARC處理器技術手冊

    ADSP1802 是一款數字信號處理器DSP),具有 Analog Devices, Inc. 超級哈佛架構單芯片計算機 (SHARC) 的 S PackageADSP1802 是一個 32 位
    的頭像 發表于 05-12 14:51 ?1552次閱讀
    ADSP1802 SHARC<b class='flag-5'>處理器</b>技術手冊

    異形拼接處理器支持哪些顯示技術?

    能夠支持液晶顯示屏的拼接,液晶顯示屏因其高分辨率、高色彩飽和度以及良好的穩定性,在商鋪櫥窗、展覽展示等領域得到了廣泛應用。 2、無縫拼接: 通過內置的高精度圖像處理算法,異形拼接處理器能夠實現液晶顯示屏的無縫拼接,
    的頭像 發表于 04-01 09:48 ?741次閱讀

    異形拼接處理器可以實現的效果

    異形拼接處理器可以實現的效果非常多樣化和創新,以下是對其可實現效果的進一步補充: 一、創意拼接顯示 1、任意角度拼接:異形拼接處理器支持0~360度任意角度的拼接顯示,使得顯示屏可以以
    的頭像 發表于 03-21 12:39 ?677次閱讀
    異形拼接<b class='flag-5'>處理器</b>可以<b class='flag-5'>實現</b>的效果