在Versal ACAP中,同一個CLB內同一列的LUT是可以級聯的,這是與前一代FPGA UltraScale+系列的一個顯著不同點。這里我們先看看Versal中LUT的結構,如下圖所示(圖片來源:Figure4, am005)。

可以看到,一個LUT6(6輸入LUT)是由4個LUT4(4輸入LUT)外加一些MUX(數據選擇器)共同構成。同時,LUT6有4個輸出端口。其中,prop端口只有在LUT用作進位邏輯時使用,且在CLB外部不可見。用做6個輸入的邏輯函數發生器時,輸出在O6端口;雙LUT5模式時,輸出在O5_1和O5_2端口。同時還可以注意到,多了一個級聯端口cascade_in,該端口用于與前一級LUT的O6輸出相連接。級聯端口不需要手工連接,工具會自動判斷是否使用該端口。
我們看一個具體的案例,如下圖所示。輸入a為6bits,b為5bits,a/b分別執行異或位縮減運算(^a,^b),然后再將兩者結果執行邏輯與。顯然a的異或位縮減運算會占用一個LUT6,b的異或位縮減運算與后續的與門共同消耗一個LUT6。

上述電路圖布線后打開Schematic視圖,鎖定其中的兩個LUT6,如下圖所示。

進一步在Device視圖中可以看到具體的物理連接方式,如下圖所示。可以看到圖片下方的LUT由O6輸出,并連接到上方LUT的級聯端口。

再從時序角度看,這里我們設定時鐘頻率為600M,在時序報告中,可以看到這部分的延遲(兩個LUT之間的布線延遲)為0.019ns。整個設計的WNS為0.923ns。

同樣的設計,如果在UltraScale+中執行,結果如下圖所示,可以看到兩個LUT相距很遠,因為UltraScale+中的LUT是不支持級聯的,這就要消耗CLB外部的布線資源。
從時序角度看,這部分的延遲為0.205ns,顯然大了很多。

綜上所示,我們可以得出如下結論:
LUT的級聯可以有效降低關鍵路徑上的延遲,同時減少CLB外部布線資源的消耗。這對于緩解布線擁塞非常有利。還要注意的是這種級聯僅限于同一個CLB中的同一列LUT,且級聯方向由下至上,這意味著級聯所用到的布線資源都在CLB內部,而不會消耗CLB外部布線資源。
編輯:jq
-
FPGA
+關注
關注
1660文章
22412瀏覽量
636309 -
LUT
+關注
關注
0文章
52瀏覽量
13145 -
CLB
+關注
關注
0文章
30瀏覽量
6359
原文標題:物理可級聯的LUT到底有什么優勢?
文章出處:【微信號:Lauren_FPGA,微信公眾號:FPGA技術驛站】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
ADM1266:可級聯超級定序器的全面解析
探索 MAX4821:8 通道可級聯繼電器驅動器的卓越性能
MAX4820:8通道可級聯繼電器驅動器的技術剖析
解析MAX4820/MAX4821:8通道可級聯繼電器驅動器
MAX4820/MAX4821:8通道可級聯繼電器驅動器的卓越之選
A2CP14216級聯放大器Teledyne防務電子
基于級聯分類器的人臉檢測基本原理
AES和SM4算法的可重構分析
【產品介紹】Altair SimLab可連接CAD的多物理場工作流
InGaP 級聯放大器 0.1–3 GHz skyworksinc
InGaP 級聯放大器 0.1–6 GHz skyworksinc
0.1 -7 GHz InGaP 級聯放大器 skyworksinc
Simcenter STAR-CCM+電磁學:多物理場環境下快速、可擴展的電磁分析工具
物理可級聯的LUT的優勢在哪?
評論