国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

hash算法在FPGA中的實現(1)

CHANBAEK ? 來源: FPGA的現今未 ? 作者: FPGA的現今未 ? 2023-09-07 17:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

FPGA的設計中,尤其是在通信領域,經常會遇到hash算法的實現。hash算法在FPGA的設計中,它主要包括2個部分,第一個就是如何選擇一個好的hash函數,減少碰撞;第二個就是如何管理hash表。本文不討論hash算法本身,僅說明hash表的管理。

原理

先對齊本文中要說明的幾個概況,如下圖所示,hash函數的輸入稱為key,hash函數的輸出,稱為hash值,或者index。以上稱呼可能不標準,但是不影響對方案的理解即可。

圖片

hash算法的實現可以用一個很簡單的圖來表示,如下圖所示,對輸入的key做hash運算后,得到index,以index作為地址,把key值存入到其index對應的hash表中。同理,在查詢的時候,也是先對key計算hash值,然后查hash表,如果hash表無效,說明沒有命中,如果有效,則判斷hash表中的key和輸入的key是否相等,相等則為命中。

圖片

舉2個例子簡單說明下,假定key5,計算出index = 0,但是add0為空,所以key5沒有命中,或者說,hash表中沒有key5這個元素。假定key6,計算hash后得到index = 3,hash表addr3中有數據,但是存放在addr3中的數據為key4,不等于key6,所以key6也沒有命中。

hash表構建

上圖hash表的示意圖其實已經說明了一個簡單的hash表的構建,在FPGA內部,常用BRAM來存放一個hash表,上圖所示hash表的深度為N,每個hash表中存放一個key。假如key的位寬為50個bit,hash后的index位寬為9bit。那么hash表就需要一個64bit*512表項,消耗1個M36K(以xilinx的資源為例)。

但是事情肯定沒有這么簡單,因為只要有hash的地方就有沖突。那么下一步就是要解決hash沖突的問題。

解決hash沖突最常見的方案就是hash鏈表,如下圖所示,key1、key5、key7具有相同的hash值,可以通過一個鏈表的形式將他們串聯在一起。這種方案在軟件是可能是非常好實現的,但是在FPGA里實現可能就比較難了,比如鏈表的最大深度為多少呢?每個hash桶的鏈表是單獨存放還是所有的存放在一起呢?

圖片

我們知道一個好的hash函數,應該是要盡可能地減少沖突的。如果從算法上我們證明了,我們的沖突最多不超過4次,那就有更加簡單的方案來實現這個hash表了。

我們把hash表做一個改進,如下圖所示,我們每個hash桶中,不再是存放一個key,而是最多存放4個key,也就是不用鏈表來解決hash沖突問題。

圖片

這樣做的好處有2個,一個是沒有了對鏈表的處理,比較簡單,第二個就是處理速度快,一次讀操作就把具有相同hash值的所有key值全部讀出來進行比較。那這種方案在FPGA的ram中如何實現呢?還是以key的寬度為50bit,index的位寬為9bit為例。

一個桶的內部結果如下圖所示,每個key還需要1bit指示是否有效,那么4個key需要514 = 204bit,用一個216bit512的BRAM即可,消耗2.5個M36K。

圖片

如果key的位寬非常大,比如是五元組,一共104bit,如果用上述的方案,那就是105*4 = 420bit,那就需要6個M36K來存放。可見,key的位寬越大,消耗的資源就越多。

hash表的優化

如果我的設計,要的就是速度,對資源的消耗不是很關系,那用上述的結構即可,如果我的設計可以犧牲一點點性能,但是需要減少資源的消耗,怎么辦呢?

我們可以把hash桶的內部結構修改下,由拼位寬改成拼深度,如下圖所示:

圖片

分別以50bit和104bit的key為例,對于50bit的key,需要的存儲為64bit5124,需要4個M36K。對于104bit的key,需要的存儲為108bit5124,需要6塊。看似需要的緩存并沒有減少,有的情況下甚至增加了。

如果hash值是8bit了,那情況就不一樣了。因為hash值為8bit和9bit的時候,BRAM的深度的增加,并沒有帶來額外的資源消耗,但是表項的寬度卻只有原來的一半,資源也就可以減少一半。比如原來hash表位 288bit256,需要消耗4個M36K,采用上述的優化方案后,表項變成144512,只需要消耗2個M36K。

除了上述的對hash桶的改進外,有時候可以同時拼寬度和深度,如下圖所示:

圖片

總結

hash表的設計,需要兼顧資源和性能問題。主要的考慮點就是充分利用BRAM 的特性來實現資源和性能的平衡。

圖片

當然,hash表也可以不放在BRAM中,存放在DDR里,那就演變成另外一個話題,如何高效地讀寫DDR中的hash表了。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1660

    文章

    22408

    瀏覽量

    636207
  • 通信
    +關注

    關注

    18

    文章

    6391

    瀏覽量

    140037
  • 函數
    +關注

    關注

    3

    文章

    4417

    瀏覽量

    67499
  • Hash算法
    +關注

    關注

    0

    文章

    43

    瀏覽量

    7657
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    FPGA光纖互感器與行波測距系統的應用研究

    光纖互感器與行波故障測距是電力系統兩類重要的先進測量技術,這兩類系統均需要對高速變化的信號進行精確采樣、實時處理并實現裝置間高精度時間同步。FPGA憑借其硬件并行處理能力和確定性時序在其
    的頭像 發表于 01-13 17:56 ?309次閱讀
    <b class='flag-5'>FPGA</b><b class='flag-5'>在</b>光纖互感器與行波測距系統<b class='flag-5'>中</b>的應用研究

    SM4算法實現分享(一)算法原理

    ,Xi、Yi、rki為字,i=0,1,2,…,31。則本算法的加密實現為: 本算法的解密實現與加密
    發表于 10-30 08:10

    復雜的軟件算法硬件IP核的實現

    Compiler)將算法編譯轉化為可綜合的 Verilog 文本,進而通過 FPGA 硬件上實現算法
    發表于 10-30 07:02

    AES加解密算法邏輯實現及其蜂鳥E203SoC上的應用介紹

    這次分享我們會簡要介紹AES加解密算法的邏輯實現,以及如何將AES算法做成硬件協處理器集成蜂鳥E203 SoC上。 AES算法介紹 AE
    發表于 10-29 07:29

    如何利用Verilog HDLFPGA實現SRAM的讀寫測試

    本篇將詳細介紹如何利用Verilog HDLFPGA實現SRAM的讀寫測試。SRAM是一種非易失性存儲器,具有高速讀取和寫入的特點。FPGA
    的頭像 發表于 10-22 17:21 ?4338次閱讀
    如何利用Verilog HDL<b class='flag-5'>在</b><b class='flag-5'>FPGA</b>上<b class='flag-5'>實現</b>SRAM的讀寫測試

    PathFinderFPGA的角色與缺陷

    自 1990 年代末以來,PathFinder 一直是 FPGA 布線(routing)階段的主力算法,為設計工具提供“能連通又不重疊”的路徑規劃方案。
    的頭像 發表于 10-15 10:44 ?512次閱讀
    PathFinder<b class='flag-5'>在</b><b class='flag-5'>FPGA</b><b class='flag-5'>中</b>的角色與缺陷

    25年11月上海FPGA算法實現與應用技術高級研修分享

    設計仿真能力。   深入學習數據流,不僅是算法FPGA&DSP設計者的需求,對于從事接口設計工作、軟件配置工作、系統測試工作,項目管理工作的同事,也同樣有非常重要的意義。實際工作
    發表于 10-11 11:55

    基于FPGA實現FOC算法之PWM模塊設計

    哈嘍,大家好,從今天開始正式帶領大家從零到一,FPGA平臺上實現FOC算法,整個算法的框架如下圖所示,如果大家對
    的頭像 發表于 07-17 15:21 ?3488次閱讀
    基于<b class='flag-5'>FPGA</b><b class='flag-5'>實現</b>FOC<b class='flag-5'>算法</b>之PWM模塊設計

    FPGA機器學習的具體應用

    ,越來越多地被應用于機器學習任務。本文將探討 FPGA 機器學習的應用,特別是加速神經網絡推理、優化
    的頭像 發表于 07-16 15:34 ?2884次閱讀

    基于Matlab與FPGA的雙邊濾波算法實現

    前面發過中值、均值、高斯濾波的文章,這些只考慮了位置,并沒有考慮相似度。那么雙邊濾波來了,既考慮了位置,有考慮了相似度,對邊緣的保持比前幾個好很多,當然實現上也是復雜很多。本文將從原理入手,采用Matlab與FPGA設計實現雙邊
    的頭像 發表于 07-10 11:28 ?4559次閱讀
    基于Matlab與<b class='flag-5'>FPGA</b>的雙邊濾波<b class='flag-5'>算法</b><b class='flag-5'>實現</b>

    基于FPGA的壓縮算法加速實現

    本設計,計劃實現對文件的壓縮及解壓,同時優化壓縮中所涉及的信號處理和計算密集型功能,實現對其的加速處理。本設計的最終目標是證明充分并行化的硬件體系結構
    的頭像 發表于 07-10 11:09 ?2388次閱讀
    基于<b class='flag-5'>FPGA</b>的壓縮<b class='flag-5'>算法</b>加速<b class='flag-5'>實現</b>

    關于RK3568核心板可以下載固件成功,但是啟動失敗,串口打印日志顯示:HASH(c): error Invalid DTB hash !

    DTB: rk3568-atk-evb1-mipi-dsi-1080p#_saradc_ch2=341.dtb HASH(c): error Invalid DTB hash ! No find valid DTB, ret=-
    發表于 07-01 09:42

    PLL技術FPGA的動態調頻與展頻功能應用

    隨著現代電子系統的不斷發展,時鐘管理成為影響系統性能、穩定性和電磁兼容性(EMI)的關鍵因素之一。FPGA設計,PLL因其高精度、靈活性和可編程性而得到廣泛應用,本文將深入探討PLL技術
    的頭像 發表于 06-20 11:51 ?2625次閱讀
    PLL技術<b class='flag-5'>在</b><b class='flag-5'>FPGA</b><b class='flag-5'>中</b>的動態調頻與展頻功能應用

    進群免費領FPGA學習資料!數字信號處理、傅里葉變換與FPGA開發等

    ~ 01、數字信號處理的FPGA實現 旨在講解前端數字信號處理算法的高效實現。首先概述了當前的FPGA技術、器件以及用于設計最先進DSP系
    發表于 04-07 16:41

    FPGA開發任務

    我想請人幫我開發一款基于FPGA的產品,把我寫好MATLAB代碼固化FPGA實現算法加速和
    發表于 03-15 10:19