国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

首頁
技術

可編程邏輯

MEMS/傳感技術

嵌入式技術

模擬技術

控制/MCU

處理器/DSP

存儲技術

EMC/EMI設計

電源/新能源

測量儀表

制造/封裝

RF/無線

接口/總線/驅動

EDA/IC設計

光電顯示

連接器

PCB設計

LEDs

汽車電子

醫療電子

人工智能

可穿戴設備

軍用/航空電子

工業控制

觸控感測

智能電網

音視頻及家電

通信網絡

機器人

vr|ar|虛擬現實

安全設備/系統

移動通信

便攜設備

物聯網

區塊鏈

HarmonyOS

RISC-V MCU

光伏

ChatGPT

IGBT

充電樁

氮化鎵

BLDC

逆變器

5G

電機控制
資源

技術文庫

新品速遞

電路圖

元器件知識

電子百科

最新技術文章

元器件搜索引擎
下載

在線工具

常用軟件

電子書

datasheet
專欄

電子說

專欄
社區

論壇

問答

小組

技術專欄

社區之星

試用中心

HarmonyOS技術社區

2023電子工程師大會
研究院
活動

設計大賽

硬創大賽

社區活動

線下會議

在線研討會

小測驗
學院

直播

課程
視頻
企業號
工具

datasheet查詢

免費評測試用

技術子站

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

如何用FPGA并行高速運算實現實時的引導濾波算法

前面一篇文章中，已經詳細的分析了引導濾波的理論，公式的推導，以及和雙邊濾波的對比分析，即在邊緣的處理上雙邊濾波會引起人為的黑/白邊。我們已經知道何博士引導濾波的優秀之處，那么本篇文章，我帶你推演，如何用FPGA并行高速運算，最小的代碼實現實時的引導濾波算法。

首先，給出上篇中最后的matlab 引導濾波的代碼，如下所示。

其中框框中為主要的計算過程，下一圖為計算a/b的最后的公式（引導圖=本身）。

雙邊濾波由于其只是在空間距離及像素相似度上進行權重計算，加權濾波，相對算法不是特別復雜，FPGA也易于實現（某司的USB工業相機2D濾波就是雙邊濾波），但是確實效果上不如引導濾波，那么引導濾波FPGA計算真有那么難嗎？為此我翻閱了一些資料，也從頭到尾推到計算了一遍，略有所成，出來和大家分享下。

在Matlab/C的加速中，引導濾波采用了盒式濾波的方式去加速，將運算復雜度從O（MN）的降低到了O（4），其方法就是先計算當前像素到原點像素組成的矩形區域的和/平方和等，對于線程的Matlab/C而言確實有很大的加速作用，相關的文章可以參考如下，對于軟件加速而言還是很不錯：

https://www.cnblogs.com/lwl2015/p/4460711.html

于是網上就有了一篇所謂的采用FPGA進行引導濾波加速的專利，鏈接如下：

https://www.doc88.com/p-4377429794731.html？r=1

另附上架構實現圖，但我估計這幾個小朋友還沒有想明白boxfilter是怎么回事，生搬硬套軟件boxfilter加速的思維嘛？？？

圖中，計算均值，平方均值，a的均值，b的均值采用了4個boxfilter，也就是說如果輸入1280*720的圖像，那就需要緩存4個那么大地址空間的區域來存儲中間變量，這顯然是不適合FPGA加速運算的啊。FPGA的意義在于高速并行技術，盡可能的避免沖入進入緩存，而是以Pipeline的方式流水線完成運算，實現真正低延時+實時處理的目標。

所以為什么不能流水線完成所有的計算操作呢？

不服來戰，沒有啥難度的……下面開始我的表演。

【第一步】

以3*3的濾波為例（這里的引導圖都是原圖），按行從傳感器或者DDR中讀取原圖，采用移位寄存后得到3*3的矩陣行，如下所示：

如上圖中，以P00-P22為例，這9個像素，我們可以通過計算得均值，以及平方的均值，緊接著繼續計算得到a與吧，詳見下圖，其中相關的參數定義如下：

P原始圖像像素集

Pm以當前像素為中心的3*3像素的均值

PPm以當前像素為中心的3*3像素平方的均值

sum1以當前像素為中心的3*3像素的和

sum1以當前像素為中心的3*3像素平方的和

a以當前像素為中心計算的參數a

b以當前像素為中心計算的參數b

am以當前像素為中心的3*3像素的a均值

bm以當前像素為中心的3*3像素的b均值

從上圖可知，通過三行組成的矩陣，以流水線方式，最快用了6個時鐘得到了參數a與b；

由于全圖流水線運行，因此從第6個時鐘開始，將持續的輸出每一個像素對應的a與b，等同于我們通過這一階段的實現方式，得到了參數a/b陣列。

另外，上圖中可知，除以9的運算我已經默默轉換為乘法與移位，clk4中將涉及到的小數點，已經提前擴大了1024倍，同等的b中也做了變更（紅/藍色字體），這就是FPGA定點化的加速的方式。

再者，由于最后的計算還需要P的參與，因此上述步驟中，需要將輸入的原始圖像進行移位延時，最終能和后續am/bm對齊。

【第二步】

接下來，進一步計算am與bm，這個就簡單的多了，類似第一步，直接緩存3行得到3*3的矩陣行，通過加權后得到am與bm。這個過程中am與bm的計算可以完全并行，每個am/bm的計算耗時3個時鐘。

詳見下圖計算流：

【第三步】

此時我們已經同時得到了am，bm，以及通過移位delay后和am/bm對齊的P，那么直接套用公式，我們就可以計算出每一個像素濾波后的值：

即輸出Q=（am*P+bm）》》10

這里還需要右移10bit，是因為前面第一步中，由于涉及到了小數，我們提前進行了1024倍的擴大，來減少計算誤差的損失。

至此，流水線操作，沒有使用boxfilter，沒有將數據回寫入DDR，我們采用了若干行line buffer的形式，完成了實時引導濾波的FPGA加速實現。

整體流程再梳理一下，相關的依賴以及流水方式，如下圖所示，應該可以看的更明白。其中綠色為第一步計，灰色為第二步計算，紅色為最后一步計算。

所以，這就是FPGA并行加速運算的價值與意義，按照我的實現方式，可以用最小的代碼實現實時的引導濾波，甚至連低端的EP4CE6E都不是問題。

同樣一個算法，可以有n種實現方式，你甚至可以把算法挪到MPSOC的PS中執行，然后忍受龜速的同時你可能還會抱怨FPGA跑的慢，CPU性能不足之類的，但是永遠不要忘記，架構的意義。正如軟件的優化，其實很多時候，并不是算法本身不行，而是你對系統底層，對計算優化的能力不行。

為什么我喜歡用FPGA加速，因為每一個門級電路，以何種并行度何種方式進行計算，一切都可以在我的掌控之中。

所以當年我說過一句話：掌握了FPGA，你便掌握了整個世界。

至此，從均值濾波到中值濾波、高斯濾波、雙邊濾波、引導濾波這些通用的2D降噪算法，我都已經通過公眾號/知識星球/博客的方式，從原理到FPGA加速實現闡述明白。

如果在這之間有任何疑問，或者我有什么不到之處的，歡迎以各種方式來跟我討論（伸手黨麻煩出門右轉）。

謝謝大家！

編輯：jq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

FPGA

FPGA

+關注

關注
1660

文章
22412

瀏覽量
636312
cpu

cpu

+關注

關注
68

文章
11279

瀏覽量
224988
濾波

濾波

+關注

關注
10

文章
703

瀏覽量
57979

原文標題：基于FPGA的引導濾波并行加速實現推演

文章出處：【微信號：sim_ol，微信公眾號：模擬在線】歡迎添加關注！文章轉載請注明出處。

評論

精選推薦
更多

文章

資料

帖子

技術資訊 I 剛柔結合印刷電路板設計

深圳(耀創)電子科技有限公司
14小時前

655 閱讀

閃迪開源SPRandom：160小時變6.2小時，企業SSD測試迎革命性提速

章鷹觀察
14小時前

1339 閱讀

開關電源限流保護電路的原理分析

電源聯盟
15小時前

660 閱讀

炮火，AI，全球飄零：逆潮中的伊朗開發者

腦極體
17小時前

1643 閱讀

高壓放大器ATA-7025在量子點薄膜的非接觸無損原位檢測中的應用

Aigtek安泰電子
1天前

1194 閱讀

實用LED照明系統電路設計攻略合集

yezi888
5.75 MB

免費

1175下載

HUAWEI DevEco Device Tool 使用指南

o_dream
2.10 MB

1積分

7下載

GoRemote虛擬電視遙控器

笑盡往事
0.64 MB

免費

0下載

kcare-uchecker檢測過時共享庫的簡單工具

山中老虎
0.01 MB

免費

0下載

llvm-mctoll將二進制文件轉換為LLVM IR

摩托羅拉
0.53 MB

免費

0下載

【飛凌嵌入式RV1126B開發板】+基本功能測試篇（1）

jennyzhaojie
2天前

548 閱讀

【飛凌嵌入式RV1126B開發板】+初識篇

jennyzhaojie
3天前

582 閱讀

樹莓派5還是香橙派5 Pro？兩款熱門開發板的詳細對比

行走的小派
3天前

934 閱讀

OrangePi RV2 深度技術評測：RISC-V AI融合架構的先行者

行走的小派
4天前

1267 閱讀

lab view NI6003搭建電路

jf_73763743
4天前

1259 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

電子發燒友

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

產品地圖

品牌地圖

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

電子發燒友

關于我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

張迎輝：mikezhang@elecfans.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

版權所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區月湖街道匍園路20號聚恒科技園1棟2301-1房
電子發燒友 （電路圖） 湘公網安備43011202000918 工商網監湘ICP備2023036445號-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
伦伦影院久久影视