国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

首頁
技術

可編程邏輯

MEMS/傳感技術

嵌入式技術

模擬技術

控制/MCU

處理器/DSP

存儲技術

EMC/EMI設計

電源/新能源

測量儀表

制造/封裝

RF/無線

接口/總線/驅動

EDA/IC設計

光電顯示

連接器

PCB設計

LEDs

汽車電子

醫療電子

人工智能

可穿戴設備

軍用/航空電子

工業控制

觸控感測

智能電網

音視頻及家電

通信網絡

機器人

vr|ar|虛擬現實

安全設備/系統

移動通信

便攜設備

物聯網

區塊鏈

HarmonyOS

RISC-V MCU

光伏

ChatGPT

IGBT

充電樁

氮化鎵

BLDC

逆變器

5G

電機控制
資源

技術文庫

新品速遞

電路圖

元器件知識

電子百科

最新技術文章

元器件搜索引擎
下載

在線工具

常用軟件

電子書

datasheet
專欄

電子說

專欄
社區

論壇

問答

小組

技術專欄

社區之星

試用中心

HarmonyOS技術社區

2023電子工程師大會
研究院
活動

設計大賽

硬創大賽

社區活動

線下會議

在線研討會

小測驗
學院

直播

課程
視頻
企業號
工具

datasheet查詢

免費評測試用

技術子站

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

HLS優化設計的最關鍵指令

HLS 優化設計的最關鍵指令有兩個：一個是流水線 (pipeline)指令，一個是數據流(dataflow)指令。正確地使用好這兩個指令能夠增強算法地并行性，提升吞吐量，降低延遲但是需要遵循一定的代碼風格。展開 (unroll) 指令是只針對 for 循環的展開指令，和流水線指令關系密切，所以我們放在一起首先我們來看一下這三個指令在 Xilinx 官方指南中的定義：

Unroll:Unroll for-loops to create multiple instances of the loopbody and its instructions that can then be scheduled independently.

Pipeline:Reduces the initiation interval by allowing theoverlapped execution of operations within a loop or function.

Dataflow:Enables task level pipelining, allowing functions andloops to execute concurrently. Used to optimize through output and/or latency.

Unroll 指令在 for 循環的代碼區域進行優化，這個指令不包含流水線執行的概念，單純地將循環體展開使用更多地硬件資源實現，保證并行循環體在調度地過程中是彼此獨立的。

Pipeline 指令在循環和函數兩個層級都可以使用，通過增加重復的操作指令（如增加資源使用量等等）來減小初始化間隔。

Dataflow 指令是一個任務級別的流水線指令，從更高的任務層次使得循環或函數可以并行執行，目的在于減小延遲增加吞吐量。

Unroll 和 Pipeline 指令相互重合的關系在于，當對函數進行流水線處理時，以下層次結構中的所有循環都會自動展開，而使用展開指令的循環并沒有給定對II的約束。在最新版本的 Vitis HLS 工具中，工具會自動分析數據之間的流水線操作關系，以II＝１為目標優化，但是還是會受限于設計本身的算法和代碼風格。下圖非常清晰地闡明了Unroll 和 Pipeline 指令的關系，Pipeline 指令放置的循環層次越高，循環展開的層次也越高，最終會導致使用更大面積的資源去實現，同時并行性也更高。

這里如果循環的邊界是變量的話，則無法展開。這將組織函數被流水線化，可以通過添加tripcount 等指令，指定循環在綜合時大概的最大最小邊界。

在循環流水線優化的過程中，有一個完美循環，半完美循環和非完美循環的代碼風格概念，只有當流水線循環完美或半完美時，才可以將嵌套循環徹底并行展開。

完美循環：只有最里面的循環才具有主體內容，在循環語句之間沒有指定邏輯，循環界限是恒定的。

半完美循環：只有最里面的循環才具有主體 (內容), 在循環語句之間沒有指定邏輯，只有最外面的循環邊界可以是可變的。

非完美循環：循環的主體內容分布在循環的各個層次或內層循環的邊界是變量。

當我們要爭去最大流水線循環的成功執行，就需要將非完美循環手動修改成完美或半完美循環。以下代碼例子給出了完美循環（左邊）和非完美循環（右邊）在Vitis HLS 中的執行結果。

Perfect_loop

#include "loop_perfect.h"

void loop_perfect (din_t A[N], dout_t B[N]) {

int i,j;

dint_t acc;

LOOP_I:for (i=0; i < 20; i++) {?

LOOP_J: for (j=0; j < 20; j++) {?

if(j==0) acc = 0;

acc += A[j] * j;

if(j==19) {

if (i%2 == 0)

B[i] = acc / 20;

else

B[i] = 0;

}

}

}

}

void loop_imperfect (din_t A[N], dout_t B[N]) {

int i,j;

dint_t acc;

LOOP_I:for(i=0; i < 20; i++){?

acc = 0;

LOOP_J: for (j=0; j < 20; j++) {?

acc += A[j] * j;

}

if (i%2 == 0)

B[i] = acc / 20;

else

B[i] = 0;

}

}

綜合完畢后，我們可以在分析窗口和綜合報告中都很清晰的看出，完美循環在執行的時候，工具自動將內層循環LOOP_J和外層循環LOOP_I合并為一整個大循環，并實現了整個大循環的流水線操作，延遲的周期數為: (400-1) *1+8-1 =406個周期數，延遲大約為 408*2.5 = 1,020 ns

非完美循環中，內層和外層循環沒有合并，只有內層循環LOOP_J 實現了流水線執行，進出內循環的浪費的時鐘周期增加了整個循環的時鐘周期，同時還有一些命令行沒有辦法跨越循環的層級實現調度上的優化，這些因素都導致了設計的延遲的增加。

責任編輯：lq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

算法

算法

+關注

關注
23

文章
4784

瀏覽量
98044
函數

函數

+關注

關注
3

文章
4417

瀏覽量
67502
數據流

數據流

+關注

關注
0

文章
129

瀏覽量
16196

評論

精選推薦
更多

文章

資料

帖子

炮火，AI，全球飄零：逆潮中的伊朗開發者

腦極體
40分鐘前

42 閱讀

高壓放大器ATA-7025在量子點薄膜的非接觸無損原位檢測中的應用

Aigtek安泰電子
20小時前

503 閱讀

11.0592MHz晶振換成12MHz后單片機串口通訊亂碼的原因分析

貿澤電子
5小時前

573 閱讀

匠芯創D213ECV實現PicoClaw極簡部署（附體驗過程）

匠芯創ArtInChip
1天前

1229 閱讀

從點云到圖像級！華為新一代896線激光雷達來襲，分辨率提升4倍

章鷹觀察
23小時前

2443 閱讀

一個用于app指向性功能高亮的庫

姚小熊27
0.92 MB

免費

1下載

解析嵌入式SDK

李桂蘭
0.86 MB

2積分

2下載

Mado跨平臺Markdown編輯器

摩托羅拉
0.51 MB

免費

0下載

VoiceChatter語音聊天工具

馬祥
0.13 MB

2積分

1下載

LuascriptCore簡單易用的移動端Lua橋接框架

吳藩
1.33 MB

2積分

1下載

【飛凌嵌入式RV1126B開發板】+基本功能測試篇（1）

jennyzhaojie
1天前

259 閱讀

【飛凌嵌入式RV1126B開發板】+初識篇

jennyzhaojie
2天前

280 閱讀

樹莓派5還是香橙派5 Pro？兩款熱門開發板的詳細對比

行走的小派
2天前

639 閱讀

OrangePi RV2 深度技術評測：RISC-V AI融合架構的先行者

行走的小派
3天前

975 閱讀

lab view NI6003搭建電路

jf_73763743
3天前

975 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

電子發燒友

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

產品地圖

品牌地圖

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

電子發燒友

關于我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

張迎輝：mikezhang@elecfans.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

版權所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區月湖街道匍園路20號聚恒科技園1棟2301-1房
電子發燒友 （電路圖） 湘公網安備43011202000918 工商網監湘ICP備2023036445號-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
伦伦影院久久影视