国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何在資源受限型應用中使用 FPGA

海闊天空的專欄 ? 來源:Kenton Williston ? 作者:Kenton Williston ? 2025-10-03 17:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Kenton Williston

投稿人:DigiKey 北美編輯

資源受限的嵌入式系統對可配置邏輯的需求與日俱增。邊緣 AI機器視覺工業(yè)自動化等應用需要靈活的應用特定邏輯,以滿足不斷變化的性能需求,同時在嚴格的功耗、尺寸和成本限制內運行。現代現場可編程門陣列 (FPGA) 可以滿足這些相互競爭的需求。

本文回顧了為資源受限型應用選擇 FPGA 時需要考慮的關鍵設計標準。然后,以 [Altera] 經過[功率和成本優(yōu)化的 FPGA] 產品組合為例,說明不同產品線如何與應用特定場景相匹配。最后重點介紹了可用于設計概念原型開發(fā)和驗證的開發(fā)套件和評估板。

選擇 FPGA 時應注意的事項

為資源受限型系統選擇 FPGA 需要考慮多種設計要求,并按照這些要求匹配正確的解決方案。有多個關鍵的 FPGA 特性需要考慮:

邏輯元件 (LE) 容量 :作為 FPGA 的基本構件,邏輯元件的數量決定了可以實現多少定制邏輯。數量越高設計就越復雜:折衷的辦法是增加功率、成本和封裝尺寸。

I/O 和存儲器 :FPGA 通常用于連接系統中的不同組件,因此 I/O 引腳的數量是一個重要的考慮因素。為了提高 I/O 性能,許多 FPGA 為 PCI Express (PCIe)、高速存儲器和千兆位收發(fā)器接口集成了強化的固定邏輯塊。

此外,一些 FPGA 還集成了模數轉換器 (ADC) 和閃存等元件。這些增強元件可減少對配套芯片的需要,從而節(jié)省了電路板空間并提高了能效。

處理器集成: 可以在 FPGA 內實現“軟”微處理器單元 (MPU),而不是使用外部處理器。這種方法可以減少系統的尺寸,但最適合對 MPU 工作負載要求不高的應用。

對于需要 MPU 具有更快速度、更高效率的應用,設計人員可以考慮使用帶有硬核處理器系統 (HPS) 的 FPGA,將 MPU 作為 FPGA 中的固定邏輯塊來實現。

硬件加速器: FPGA 通常包含專用數字信號處理 (DSP) 塊,可有效處理像運動控制這樣的計算密集型任務。高端設備可能會配備專門用于 AI 工作負載的張量塊。這些加速器塊的功能在不同的 FPGA 系列中差別很大,會極大地影響系統的整體性能。

封裝和功率優(yōu)化 :有些 FPGA 專門設計用于最大限度地減少物理和電氣占用空間。例如,它們可以提供低功耗睡眠模式。

工具 :創(chuàng)建自定義邏輯是一項艱巨的挑戰(zhàn),尤其是對于新手設計人員而言。Altera 的 [Quartus Prime] 設計軟件等工具的出現簡化了這一過程。

Quartus Prime 提供了對開發(fā)人員友好的體驗、廣泛的預建邏輯塊目錄以及自動將這些邏輯塊互連的能力,從而使 FPGA 設計更加易于實現。該工具集成了常用的 AI 和機器學習 (ML) 工作流,能夠讓使開發(fā)人員在 FPGA 上部署 Linux 和 Zephyr 等流行的操作系統 (OS)。

上述功能可大大加快 FPGA 的設計速度,因此在選擇器件時,工具功能也是一個重要的考慮因素。

面向高級嵌入式工作負載的高性能計算

為了說明設計要求如何影響 FPGA 的選擇,不妨從需要超高計算密度、帶寬和集成度的高端應用入手。下面我們以高級邊緣 AI 應用和高性能工業(yè)網關為例作詳細分析。

[Agilex 3] FPGA(圖 1)專為滿足這些應用需求而設計,可提供最高 135K LE。這些芯片有純 FPGA 和片上系統 (SoC) 兩種類型。SoC 器件集成了雙核 800 兆赫 (MHz) [Arm?] Cortex?-A55,能夠讓 FPGA 處理復雜的軟件堆棧,如人機界面 (HMI) 或網絡堆棧。

這種可編程結構具有 AI 張量塊,能夠提供高達每秒 2.8 萬億次 INT8 運算 (TOPS)。這些張量塊支持各種計算格式,包括 FP16、FP19、FP32 和 BFLOAT16,并進行了優(yōu)化,實現了對 AI 工作負載的高效執(zhí)行。此外,還包括可變精度 DSP 塊,為通用信號處理提供高達每秒 180 千兆次浮點運算 (GFLOPS) 的性能。

Altera Agilex 3 以其高性能 DSP 和 AI 張量模塊而著稱圖片圖 1:Agilex 3 以其高性能 DSP 和 AI 張量模塊而著稱。(圖片來源:Altera)

高速連接是 Agilex 3 架構的另一個優(yōu)勢。收發(fā)器支持高達每秒 12.5 千兆比特 (Gb/s) 的數據傳輸速率,并提供用于 PCIe 3.0、萬兆位以太網 (GbE) 和 LPDDR4 存儲器接口的強化 I/O 塊。對 IEEE 1588 精確時間同步的支持進一步增強了其對實時工業(yè)網絡的適用性。

[A3CZ135BB18AE7S] 器件展示了該系列的功能。它包括 135K LE、184 個 DSP 塊,并提供 2.54 TOPS。

復雜系統的高級集成

對于工業(yè)自動化和中程視覺系統等應用而言,原始計算能力的重要性可能不如對帶有大量定制邏輯和 I/O 的復雜配置的支持能力。[Cyclone V] FPGA 非常適合這些應用場景,提供最高 300K LE 和廣泛的高速接口。與 Agilex 3 一樣,這些芯片也有純 FPGA 和 SoC 兩種變型。其中 SoC 器件集成了雙核 Arm Cortex-A9。

這些芯片中的可編程結構包括可變精度 DSP 塊,支持三重 9 × 9 和雙重 18 × 18 定點乘法,以及 27 × 27 定點或浮點乘法。這些塊可用于高級信號處理和 AI。

廣泛的 I/O 組合支持多種電壓等級和接口類型。強化邏輯塊可實現先進的高速連接,包括 PCIe 2.0、DDR3 控制器和收發(fā)器,運行速度高達 6.144 Gb/s。

開發(fā)人員可以使用 [DK-DEV-5CSXC6N-B 開發(fā)套件] 評估 Cyclone V SoC 系列(圖 2)。該套件專為快速開發(fā)復雜的高吞吐量系統原型而設計。

Altera DK-DEV-5CSXC6N-B Cyclone V 開發(fā)套件圖片圖 2:DK-DEV-5CSXC6N-B Cyclone V 開發(fā)套件支持高性能原型開發(fā)。(圖片來源:Altera)

該套件有幾個顯著特性:

  • 雙以太網端口、PCIe x4 連接器和高速夾層卡 (HSMC),每個方向有 16 個 LVDS 通道
  • USB 2.0 OTG、CANUART 和雙行文本 LCD 接口
  • FPGA 側和 HPS 側各 1 千兆字節(jié) (Gb) DDR3 SDRAM、128 兆字節(jié) (Mb) 四通道 SPI 閃存和 4 Gb microSD 卡

該電路板采用 [5CSXFC5D6F31C8N] 器件,包括一個運行頻率為 600 MHz 的雙核 Arm Cortex-A9 處理器、85K LE、87 個 DSP 塊和 288 個 I/O 引腳,封裝為 31 mm × 31 mm 的 896-FBGA。

采用緊湊型封裝的高能效可配置邏輯器件

許多應用都受到空間和功耗的嚴格限制。例如傳感器接口、電源定序和外設控制。[MAX 10] 系列等 FPGA 為這些情況提供了有效的解決方案。MAX 10 器件的配置從 2K LE 到 50K LE 不等,封裝尺寸小至 3 mm × 3 mm。

主要功能包括多達兩個集成式 12 位 ADC、一個 DDR3 存儲器接口以及支持 18 × 18 和雙重 9 × 9 定點模式的乘法器模塊。支持雙圖像存儲的片上閃存允許 FPGA 在沒有外部存儲設備的情況下進行自我配置。

省電功能是 MAX 10 系列最顯著的屬性之一。內置睡眠模式可將動態(tài)功耗降低 95% 。借助片上閃存,器件還可在 10 毫秒 (ms) 內完全斷電并恢復運行。

單電源選項進一步簡化了供電。這使得 MAX 10 器件特別適合用于功率域可能需要先于系統其他部分聯機的監(jiān)控場合。

對 MAX 10 感興趣的開發(fā)人員可以使用 [EK-10M08E144] MAX 10 FPGA 評估板(圖 3)對該系列進行評估。該電路板可通過 [Arduino] UNO R3 連接器和測試點訪問外部信號,其布局設計可支持對 ADC 性能和整體電源行為的測量。

Altera EK-10M08E144 MAX 10 FPGA 評估板圖片圖 3:EK-10M08E144 MAX 10 FPGA 評估板可輕松訪問關鍵 I/O。(圖片來源:Altera)

電路板采用 [10M08SAE144C8G] 器件,包括 8K LE 和一個 ADC,封裝為 144 引腳 LQFP。除內置硬件資源外,該 FPGA 還支持基于 RISC-V 的 Nios V 軟處理器,無需外部微控制器單元 (MCU),設計人員即可實現輕量級控制功能。

適合中程應用的均衡性能

有些應用需要更大的邏輯和 I/O 容量,而入門級 FPGA 無法提供。例如傳感器融合、運動控制和芯片到芯片橋接。[Cyclone 10 LP] FPGA 為滿足這些要求,在器件中提供了多達 120K 的 LE 和 525 個 I/O 引腳,并針對成本敏感型應用中的功率和帶寬平衡進行了優(yōu)化。

與 MAX 10 一樣,該系列包括適用于濾波、控制回路和基本 AI 推斷等工作負載的 DSP 塊。與 MAX 10 不同,Cyclone 10 LP 器件集成了真正的 LVDS 收發(fā)器和片上終端 (OCT),以支持高速數字接口。

對 Cyclone 10 LP 感興趣的開發(fā)人員可以使用 [EK-10CL025U256] Cyclone 10 評估套件(圖 4)對該系列進行評估。該電路板提供 Arduino UNO R3 和 [Digilent] Pmod 連接器,擴展方便簡單。其他特性包括 GbE、USB 2.0、128 Mb SDRAM 和 64 Mb 閃存。

Altera EK-10CL025U256 Cyclone 10 評估套件示意圖(點擊放大)圖 4:EK-10CL025U256 Cyclone 10 評估套件支持輕松外設擴展。(圖片來源:Altera)

該電路板采用 [10CL025YU256C8G] 器件,包括 25K LE、66 個 DSP 塊和 150 個 I/O 引腳,封裝尺寸為 14 mm × 14 mm。與 MAX 10 一樣,Cyclone 10 LP 系列也支持 Nios V 軟處理器。

結語

現在,設計人員在嵌入式系統中實現定制邏輯時要比以往任何時候都更加靈活。高性能應用可從集成了 AI 加速器的 FPGA 中獲益。低功耗設計可以利用具有睡眠模式的器件。I/O 密集型系統可以利用具有大量引腳數和高速接口的芯片。重要的是,所有這些功能都可以通過易于使用的工具包,在資源受限型嵌入式系統的嚴格限制下實現。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1660

    文章

    22408

    瀏覽量

    636218
  • 嵌入式系統
    +關注

    關注

    41

    文章

    3747

    瀏覽量

    133621
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    為什么在FPGA設計中使用MicroBlaze V處理器

    在各類行業(yè)與應用中,經常能看到許多 FPGA 設計。一個非常常見的現象是:設計者常常用復雜的有限狀態(tài)機(FSM)來實現 I2C、SPI、GPIO 時序控制等功能。
    的頭像 發(fā)表于 12-19 15:29 ?8319次閱讀
    為什么在<b class='flag-5'>FPGA</b>設計<b class='flag-5'>中使</b>用MicroBlaze V處理器

    何在AMD Vitis Unified IDE中使用系統設備樹

    您將在這篇博客中了解系統設備樹 (SDT) 以及如何在 AMD Vitis Unified IDE 中使用 SDT 維護來自 XSA 的硬件元數據。本文還講述了如何對 SDT 進行操作,以便在 Vitis Unified IDE 中實現更靈活的使用場景。
    的頭像 發(fā)表于 11-18 11:13 ?3112次閱讀
    如<b class='flag-5'>何在</b>AMD Vitis Unified IDE<b class='flag-5'>中使</b>用系統設備樹

    使用Xilinx 7系列FPGA的四位乘法器設計

    隨著 IoT、邊緣計算等應用對低位寬、高并行、高效率算術運算的需求攀升,基礎算術電路,如 4 位乘法,如何在 FPGA 上做到“資源最小化+速度極致”便成為一道新的挑戰(zhàn)。來自日本信州大學
    的頭像 發(fā)表于 11-17 09:49 ?3460次閱讀
    使用Xilinx 7系列<b class='flag-5'>FPGA</b>的四位乘法器設計

    Altera全新推出MAX 10 FPGA封裝新選擇

    Altera 全新推出 MAX 10 FPGA 封裝新選擇,采用可變間距球柵陣列 (VPBGA) 技術并已開始批量出貨,可為空間受限及 I/O 密集應用的設計人員帶來關鍵技術優(yōu)勢。
    的頭像 發(fā)表于 11-10 16:38 ?1841次閱讀
    Altera全新推出MAX 10 <b class='flag-5'>FPGA</b>封裝新選擇

    何在VS code中配置Zephyr集成開發(fā)環(huán)境

    上一篇文章介紹了如何在VS code中使用瑞薩官方插件為RA芯片創(chuàng)建項目與項目調試,相信大家對RA在VS code中的開發(fā)有了基礎的了解。
    的頭像 發(fā)表于 11-05 14:46 ?1507次閱讀
    如<b class='flag-5'>何在</b>VS code中配置Zephyr集成開發(fā)環(huán)境

    如何調用FPGA板上的按鍵資源

    今天主要介紹一下我們團隊是如何調用FPGA板上的按鍵資源的。 首先,初始化按鍵模塊: 具體初始化函數調用如下: 其次,定義按鍵掃描函數: u8 KEY_Scan(u8 mode
    發(fā)表于 10-30 08:05

    何在vivadoHLS中使用.TLite模型

    本帖欲分享如何在vivadoHLS中使用.TLite模型。在Vivado HLS中導入模型后,需要設置其輸入和輸出接口以與您的設計進行適配。 1. 在Vivado HLS項目中導入模型文件 可以
    發(fā)表于 10-22 06:29

    RTThread線程退出后rt_malloc動態(tài)創(chuàng)建的資源沒有釋放怎么解決?

    。如何在線程被退出前釋放線程申請的資源?能否通過memtrace中的信息在線程退出前將線程申請的資源釋放掉?
    發(fā)表于 10-13 07:06

    何在FPGA部署AI模型

    如果你已經在用 MATLAB 做深度學習,那一定知道它的訓練和仿真體驗非常絲滑。但當模型要真正落地到 FPGA 上時,往往就會卡住:怎么把網絡結構和權重優(yōu)雅地搬到硬件里?
    的頭像 發(fā)表于 09-24 10:00 ?4425次閱讀
    如<b class='flag-5'>何在</b><b class='flag-5'>FPGA</b>部署AI模型

    何在智多晶FPGA上使用MIPI接口

    大家好呀!今天我們來聊聊一個非常實用的話題——如何在智多晶FPGA上使用MIPI接口。不管是做攝像頭圖像采集還是屏幕顯示控制,MIPI都是非常常見的接口標準。掌握了它,你的視頻項目開發(fā)效率將大大提升!
    的頭像 發(fā)表于 09-11 09:37 ?1175次閱讀

    聊聊FPGA中的TDC原理

    今天我們不談高大上的物理學,只聊聊如何在 FPGA 中,用一串加法器和 D 觸發(fā)器,“數清楚時間”——這就是時間數字轉換器(TDC)的魅力。
    的頭像 發(fā)表于 09-02 15:15 ?2094次閱讀
    聊聊<b class='flag-5'>FPGA</b>中的TDC原理

    請問如何在 Keil μVision 或 IAR EWARM 中使用觀察點進行調試?

    何在 Keil μVision 或 IAR EWARM 中使用觀察點進行調試?
    發(fā)表于 08-20 06:29

    基于FPGA的壓縮算法加速實現

    本設計中,計劃實現對文件的壓縮及解壓,同時優(yōu)化壓縮中所涉及的信號處理和計算密集功能,實現對其的加速處理。本設計的最終目標是證明在充分并行化的硬件體系結構 FPGA 上實現該算法時,可以大大提高該算
    的頭像 發(fā)表于 07-10 11:09 ?2388次閱讀
    基于<b class='flag-5'>FPGA</b>的壓縮算法加速實現

    請問如何在C++中使用NPU上的模型緩存?

    無法確定如何在 C++ 中的 NPU 上使用模型緩存
    發(fā)表于 06-24 07:25

    Xilinx Ultrascale系列FPGA的時鐘資源與架構解析

    Ultrascale是賽靈思開發(fā)的支持包含步進功能的增強FPGA架構,相比7系列的28nm工藝,Ultrascale采用20nm的工藝,主要有2個系列:Kintex和Virtex
    的頭像 發(fā)表于 04-24 11:29 ?2604次閱讀
    Xilinx Ultrascale系列<b class='flag-5'>FPGA</b>的時鐘<b class='flag-5'>資源</b>與架構解析