国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

使用流水線寄存器實現(xiàn)最佳時序性能方案

YCqV_FPGA_EETre ? 來源:未知 ? 作者:劉勇 ? 2019-07-26 16:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

引言

UltraRAM 原語(也稱為 URAM)可在 Xilinx UltraScale +? 架構中使用,而且可用來高效地實現(xiàn)大容量深存儲器。

由于大小和性能方面的要求,通常這類存儲器不適合使用其他存儲器資源來實現(xiàn)。

URAM 原語具有實現(xiàn)高速內(nèi)存訪問所需的可配置流水線屬性和專用級聯(lián)連接。流水線階段和級聯(lián)連接是使用原語上的屬性來配置的。

本篇博文描述的是通過將 URAM 矩陣配置為使用流水線寄存器來實現(xiàn)最佳時序性能的方法。

注意:本文由 Pradip K Kar、Satyaprakash Pareek 和 Chaithanya Dudha 共同撰寫。

流水線需求:

通過在矩陣結構中連接多個 URAM,從可用的 URAM 原語實現(xiàn)大容量深存儲器。

矩陣由 URAM 的行和列組成。一列中的 URAM 使用內(nèi)置級聯(lián)電路級聯(lián),且多列 URAM 通過外部級聯(lián)電路互連,這被稱為水平級聯(lián)電路。

作為示例,圖 1 示出了針對 64K 深 x 72 位寬存儲器的 4x4 URAM 矩陣的矩陣分解。

圖 1:4 行 4 列的 URAM 矩陣(可實現(xiàn) 64K 深 72 位寬的存儲器)

在沒有流水線設計的情況下,深度聯(lián)結構會導致內(nèi)存訪問出現(xiàn)大的時鐘輸出延遲。例如,在默認情況下,上述 URAM 矩陣可以達到約 350 MHz。要以更快的速度訪問內(nèi)存,應插入流水線。如果在網(wǎng)表中指定了一定數(shù)量的輸出時延,Vivado Synthesis 即會自動實現(xiàn)此功能。

指定 RTL 設計中的流水線:

有兩種方法可以用來指定 RTL 設計中的流水線的用途,可以通過使用 XPM 流程,也可以通過行為 RTL 來推斷內(nèi)存。

如果 RTL 設計通過 XPM 流程來創(chuàng)建 URAM 內(nèi)存,則用戶可以將對流水線的要求指定為 XPM 實例的參數(shù)。參數(shù)“READ_LATENCY_A/B”用于捕獲內(nèi)存的時延要求。

可用的流水線階段數(shù)是 LATENCY 值減去 2。例如,如果 Latency 設置為 10,則允許 8 個寄存器階段用于流水線操作。另外兩個寄存器可用來創(chuàng)建 URAM 本身。

圖 2:使用 XPM 設置流水線設計

如果用戶使用 Vivado 用戶指南中提供的模板來編寫 RTL,并通過此方法來創(chuàng)建 URAM,那么,他們可以在 URAM 的輸出時創(chuàng)建盡可能多的寄存器階段。唯一的要求是,與數(shù)據(jù)一起,流水線寄存器的啟用也需要流水線化。

圖 3:URAM 塊輸出時的數(shù)據(jù)及流水線啟用規(guī)范

圖 3 顯示數(shù)據(jù)和流水線的啟用

圖 4 示出了 RTL 級 RAM 流水線設計示例。

圖 4:用來指定數(shù)據(jù)和流水線啟用的 verilog 模板

分析日志文件:

Vivado Synthesis 根據(jù)上下文環(huán)境和場景發(fā)布與 URAM 流水線相關的不同消息。下表說明要在 vivado.log文件中查找的一些消息和要采取的相應操作。

請注意,推薦的流水線階段基于可實現(xiàn)最高性能(800 MHz+)的完全流水線化的矩陣。此建議不受實際時序約束的限制。

時間性能估計:

下表說明流水線寄存器的數(shù)量與可實現(xiàn)的最大估計頻率之間的關系。

請注意,實際的時間數(shù)仍將取決于最終地點和路線結果。

下列數(shù)字基于 speedgrade-2 Virtex? UltraScale+? 部件以及我們使用 4x4 矩陣實現(xiàn)的 64K x 72 URAM示例工程。

數(shù)據(jù)路徑延遲具有以下一個或多個組件。

Tco = 1.38 ns, Clk To CascadeOut on URAM

Tco = 0.82 ns, Clk To CascadeOut on URAM with OREG=true

Tco = 0.726 ns, Clk to Dataout on URAM with OREG=true, CASCADE_ORDER = LAST

URAM -> URAM級聯(lián)延遲= 0.2 ns

URAM -> LUT信號網(wǎng)絡延遲= 0.3 ns

LUT傳輸延遲= 0.125 ns

LUT -> LUT信號網(wǎng)絡延遲= 0.2 ns

LUT5 -> FF延遲= 0.05

結論:

URAM 原語是創(chuàng)建容量非常大的 RAM 結構的有效方法。它們被設置為易于級聯(lián)以便在您的設計中創(chuàng)建容量更大的 RAM。

但是,太多這類結構級聯(lián)在一起可能會通過 RAM 產(chǎn)生很大的延遲。從長遠來看,花時間讓您的 RAM 完全流水線化會帶來很多好處。

URAM 原語是創(chuàng)建容量非常大的 RAM 結構的有效方法。它們被設置為易于級聯(lián)以便在您的設計中創(chuàng)建容量更大的 RAM。

但是,太多這類結構級聯(lián)在一起可能會通過 RAM 產(chǎn)生很大的延遲。從長遠來看,花時間讓您的 RAM 完全流水線化會帶來很多好處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 寄存器
    +關注

    關注

    31

    文章

    5608

    瀏覽量

    129966
  • 時序設計
    +關注

    關注

    0

    文章

    21

    瀏覽量

    44132

原文標題:通過在 Vivado Synthesis 中使 URAM 矩陣自動流水線化來實現(xiàn)最佳時序性能

文章出處:【微信號:FPGA-EETrend,微信公眾號:FPGA開發(fā)圈】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    智造中樞:疆鴻智能DEVICENET轉(zhuǎn)MODBUS RTU網(wǎng)關在食品包裝流水線的融合之舞

    ?智造中樞:疆鴻智能DEVICENET轉(zhuǎn)MODBUS RTU網(wǎng)關在食品包裝流水線的融合之舞 在現(xiàn)代化食品加工包裝流水線中,自動化系統(tǒng)的神經(jīng)脈絡需要暢通無阻地連接每一個環(huán)節(jié)。歐姆龍PLC作為核心控制
    的頭像 發(fā)表于 01-29 14:16 ?127次閱讀
    智造中樞:疆鴻智能DEVICENET轉(zhuǎn)MODBUS RTU網(wǎng)關在食品包裝<b class='flag-5'>流水線</b>的融合之舞

    流水線基本結構

    3級流水線(Cortex-M0) 分為以下三個階段: 取指(Fetch):從存儲中讀取指令。 解碼(Decode):解析指令的操作類型和操作數(shù)。 執(zhí)行(Execute):執(zhí)行指令(如算術運算、內(nèi)存
    發(fā)表于 11-21 07:35

    如何更好地選擇工業(yè)流水線上用的條碼掃碼

    五花八門的設備,如何精準挑選出符合流水線需求的條碼掃碼,成為不少企業(yè)采購時的難題。其實,只要圍繞核心性能指標、匹配具體應用場景,并參考靠譜品牌,就能輕松找到適配
    的頭像 發(fā)表于 11-05 15:49 ?317次閱讀
    如何更好地選擇工業(yè)<b class='flag-5'>流水線</b>上用的條碼掃碼<b class='flag-5'>器</b>?

    常用硬件加速的方法

    空間換時間。而狀態(tài)機則相反。流水線級數(shù)越多,意味著流水線被切的越細,每一級流水線內(nèi)容納的硬件邏輯越少,在兩級寄存器(每一級流水線
    發(fā)表于 10-29 06:20

    如何對蜂鳥e203內(nèi)核乘除法器進行優(yōu)化

    除數(shù)和被除數(shù)分成若干個部位,并在每個時鐘周期內(nèi)同時計算多個部位,實現(xiàn)了除法器的快速計算。具體而言,除法器主要由以下兩部分組成: 流水線寄存器:用于保存除法器每個時鐘周期內(nèi)所需的數(shù)據(jù)和控制信息。 核心除法
    發(fā)表于 10-24 06:47

    流水線輸送帶數(shù)據(jù)采集物聯(lián)網(wǎng)解決方案

    在自動化流水線的輸送帶中,速度是一個十分重要的變量。速度閉環(huán)控制系統(tǒng)是由速度傳感、控制、驅(qū)動和電機組成。速度傳感檢測電機軸實際速度,
    的頭像 發(fā)表于 08-07 13:31 ?497次閱讀
    <b class='flag-5'>流水線</b>輸送帶數(shù)據(jù)采集物聯(lián)網(wǎng)解決<b class='flag-5'>方案</b>

    激光振鏡運動控制流水線激光打標上的應用

    正運動流水線激光打標解決方案
    的頭像 發(fā)表于 08-05 11:26 ?1003次閱讀
    激光振鏡運動控制<b class='flag-5'>器</b>在<b class='flag-5'>流水線</b>激光打標上的應用

    流水線掃碼升級選NVF230!工業(yè)二維碼讀碼方案實測

    在現(xiàn)代流水線生產(chǎn)中,給每件產(chǎn)品貼上獨特的“電子身份證”——DPM條碼,再用工業(yè)二維碼讀碼實時追蹤定位,早已是保障高效運轉(zhuǎn)的關鍵操作。但輪到飲料行業(yè),給瓶身或瓶蓋上的DPM條碼“打卡”,卻成了讓不少
    的頭像 發(fā)表于 07-17 15:09 ?552次閱讀
    <b class='flag-5'>流水線</b>掃碼升級選NVF230!工業(yè)二維碼讀碼<b class='flag-5'>器</b><b class='flag-5'>方案</b>實測

    自動化開裝封碼流水線數(shù)據(jù)采集解決方案

    運行數(shù)據(jù)的實時采集與深度分析成為企業(yè)優(yōu)化生產(chǎn)、降本增效的關鍵。 現(xiàn)場流水線上包括開箱機、裝箱機、封箱機、貼標機、碼垛機等設備,已接入PLC實現(xiàn)自動化控制,產(chǎn)品從開箱、裝填、封箱再到貼標、碼垛,生產(chǎn)效率得到大
    的頭像 發(fā)表于 06-27 15:56 ?769次閱讀
    自動化開裝封碼<b class='flag-5'>流水線</b>數(shù)據(jù)采集解決<b class='flag-5'>方案</b>

    面包成型流水線數(shù)據(jù)采集遠程監(jiān)控系統(tǒng)

    該食品加工企業(yè)主要從事多種口味的面包生產(chǎn)及銷售,擁有一整條完整的面包成型流水線,能夠自動進行面塊切割、整平折疊、多次搟薄、冷庫發(fā)酵、包油加餡、排盤等工序,各個變頻和伺服通過PLC進行集中控制,要求實現(xiàn)
    的頭像 發(fā)表于 06-16 17:11 ?720次閱讀
    面包成型<b class='flag-5'>流水線</b>數(shù)據(jù)采集遠程監(jiān)控系統(tǒng)

    遠程io模塊在汽車流水線的應用

    在汽車制造領域,生產(chǎn)流水線的高效、穩(wěn)定運行是保障產(chǎn)品質(zhì)量與生產(chǎn)效率的關鍵。隨著工業(yè) 4.0 和智能制造理念的深入,汽車生產(chǎn)企業(yè)對流水線自動化控制提出了更高要求,不僅要實現(xiàn)設備間的精準協(xié)同作業(yè),還需
    的頭像 發(fā)表于 06-11 15:26 ?683次閱讀

    工業(yè)4.0時代,為什么你的流水線必須配備固定式掃碼

    在工業(yè)4.0時代,制造業(yè)正朝著智能化、自動化的方向飛速發(fā)展。在這一進程中,流水線作為生產(chǎn)的關鍵環(huán)節(jié),配備固定式掃碼已成為提升生產(chǎn)效率、保證產(chǎn)品質(zhì)量和實現(xiàn)智能化管理的必然選擇。固定式掃碼
    的頭像 發(fā)表于 06-09 16:12 ?569次閱讀
    工業(yè)4.0時代,為什么你的<b class='flag-5'>流水線</b>必須配備固定式掃碼<b class='flag-5'>器</b>?

    工業(yè)流水線上用的條碼掃碼,如何選擇與使用?

    在現(xiàn)代工業(yè)自動化生產(chǎn)中,條碼掃碼(又稱工業(yè)讀碼)作為數(shù)據(jù)采集的關鍵設備,廣泛應用于流水線上,有效提升了生產(chǎn)效率并減少了人為錯誤。然而,面對市場上種類繁多、功能各異的條碼掃碼,如何
    的頭像 發(fā)表于 05-14 15:18 ?895次閱讀
    工業(yè)<b class='flag-5'>流水線</b>上用的條碼掃碼<b class='flag-5'>器</b>,如何選擇與使用?

    RISC-V五級流水線CPU設計

    本文實現(xiàn)的CPU是一個五級流水線的精簡版CPU(也叫PCPU,即pipeline),包括IF(取指令)、ID(解碼)、EX(執(zhí)行)、MEM(內(nèi)存操作)、WB(回寫)。
    的頭像 發(fā)表于 04-15 09:46 ?1731次閱讀
    RISC-V五級<b class='flag-5'>流水線</b>CPU設計

    AXI握手時序優(yōu)化—pipeline緩沖

    skid buffer(pipeline緩沖)介紹 ??解決ready/valid兩路握手的時序困難,使路徑流水線化。 ??只關心valid時序參考這篇寫得很好的博客鏈接:?握手協(xié)議
    的頭像 發(fā)表于 03-08 17:10 ?1331次閱讀
    AXI握手<b class='flag-5'>時序</b>優(yōu)化—pipeline緩沖<b class='flag-5'>器</b>