国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

干貨 | 機器學習加持,基于FPGA的高性能視覺應用方案設計

5CTi_cirmall ? 來源:YXQ ? 2019-07-16 09:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著攝像頭和其他設備產生的數據在快速增長,促使人們運用機器學習從汽車、安防和其他應用產生的影像中提取更多有用的信息。專用器件有望在嵌入式視覺應用中實現高性能機器學習 (ML) 推理。但是此類器件大都處于早期開發階段,因為設計人員正在努力尋找最有效的算法,甚至人工智能 (AI) 研究人員也在迅速推演新方法。

目前,開發人員一般使用針對 ML 的可用 FPGA 平臺來構建嵌入式視覺系統,以期滿足更高的性能要求。與此同時,他們可以保持所需的靈活性,以跟上機器學習發展的步伐。

本文將介紹 ML 處理的要求,以及為何 FPGA 能解決許多性能問題。然后,將介紹一個合適的基于 FPGA 的 ML 平臺及其使用方法。

機器學習算法和推理引擎

在 ML 算法中,卷積神經網絡 (CNN) 已成為圖像分類的首選解決方案。其圖像識別的準確率非常高,因而得以廣泛應用于多種應用,跨越不同的平臺,例如智能手機、安防系統和汽車駕駛員輔助系統。作為一種深度神經網絡 (DNN),CNN 使用的神經網絡架構由專用層構成。在對標注圖像進行訓練期間,它會從圖像中提取特征,并使用這些特征給圖像分類(參見“利用現成的軟硬件啟動機器學習”)。

CNN 開發人員通常在高性能系統或云平臺上進行訓練,使用圖形處理單元 (GPU) 加速在標注圖像數據集(通常數以百萬計)上訓練模型所需的巨量矩陣計算。訓練完成之后,訓練好的模型用在推理應用中,對視頻流中的新圖像或幀進行分類。推理部署完成后,訓練好的模型仍然需要執行同樣的矩陣計算,但由于輸入量要少很多,開發人員可以將 CNN 用于在通用硬件上運行的普通機器學習應用(參見“利用 Raspberry Pi 構建機器學習應用”)。

然而,對于許多應用而言,通用平臺缺乏在 CNN 推理中同時實現高準確率和高性能所需的性能。優化技術和替代 CNN 架構(如 MobileNet 或 SqueezeNet)有助于降低平臺要求,但通常會犧牲準確率并增加推理延時,而這可能與應用要求相沖突。

與此同時,快速發展的算法使得機器學習 IC 的設計工作變得復雜,因為需要機器學習 IC 既要足夠專門化以加速推理,又要足夠通用化以支持新算法。FPGA 多年來一直扮演著這一特定角色,提供加速關鍵算法所需的性能和靈活性,解決了通用處理器性能不足或沒有專用器件可用的問題。

FPGA 作為機器學習平臺

對于機器學習而言,GPU 仍然是標桿——這是早期的 FPGA 根本無法企及的。最近出現的一些器件,如 Intel Arria 10 GX FPGA 和 Lattice Semiconductor ECP5 FPGA,大大縮小了先進 FPGA 和 GPU 之間的差距。對于某些使用緊湊的整數數據類型的 DNN 架構來說,此類 FPGA 的性能/功耗比甚至高于主流 GPU。

高級 FPGA 組合了嵌入式存儲器和數字信號處理 (DSP) 資源,對于一般矩陣乘法 (GEMM) 運算能夠實現很高的性能。其嵌入式存儲器靠近計算引擎,從而緩解了 CPU 存儲器瓶頸,而這種瓶頸通常會限制通用處理器上機器學習算法的性能。反之,相比于典型 DSP 器件(圖 1),FPGA 上的嵌入式 DSP 計算引擎提供了更多的并行乘法器資源。FPGA 廠商在交付專門用于機器學習的 FPGA 開發平臺時充分利用了這些特性。

例如,Intel 最近推出的支持 FPGA 的 OPENVINO? 擴展了該平臺將推理模型部署到不同類型設備(包括 GPU、CPU 和 FPGA)的能力。在該平臺上,開發人員可使用 Intel 的深度學習推理引擎工作流程,其中整合了 Intel 深度學習部署工具包和在 Intel OPENVINO 工具包中提供的 Intel 計算機視覺軟件開發套件 (SDK)。開發人員使用 SDK 的應用編程接口 (API) 構建模型,并且可利用 Intel 的運行模型優化器針對不同硬件平臺進行優化。

深度學習部署工具包旨在與 Intel DK-DEV-10AX115S-A Arria 10 GX FPGA 開發套件配合使用,讓開發人員能從領先的 ML 框架(包括 Caffe 和 TensorFlow)導入訓練好的模型(圖 2)。在諸如 Arria 10 GX FPGA 開發套件之類目標平臺或使用 Arria 10 GX FPGA 器件的定制設計上,工具包中的模型優化器和推理引擎分別處理模型轉換和部署。

為了遷移預訓練模型,開發人員使用基于 Python 的模型優化器生成了一個中間表示 (IR),該表示包含在一個提供網絡拓撲的 xml 文件和一個以二進制值提供模型參數的 bin 文件中。除了生成 IR 之外,模型優化器還會執行一項關鍵功能——移除模型中用于訓練但對推理毫無作用的層。此外,該工具會在可能的情況下將每個提供獨立數學運算的層合并到一個組合層中。

通過這種網絡修剪和合并,模型變得更緊湊,進而加快推理時間并減少對目標平臺的存儲器需求。

Intel 推理引擎是一個 C++ 庫,其中包含一組 C++ 類。這些類對于受支持的目標硬件平臺來說是通用的,因此可以在各個平臺上實現推理。對于推理應用而言,開發人員使用像 CNNNetReader 這樣的類來讀取 xml 文件 (ReadNetwork) 中包含的 CNN 拓撲以及 bin 文件 (ReadWeights) 中包含的模型參數。模型加載完成后,調用類方法 Infer() 執行阻塞推理,同時調用類方法 StartAsync() 執行異步推理,當推理完成時使用等待或完成例程處理結果。

Intel 在 OPENVINO 環境提供的多個示例應用程序中演示了完整的工作流程和詳細的推理引擎 API 調用。例如,安全屏障攝像機示例應用程序展示了使用推理模型流水線,以首先確定車輛邊界框(圖 3)。流水線中的下一個模型檢查了邊界框中的內容,識別車輛類別、顏色和車牌位置等車輛屬性。

流水線中的最后一個模型使用這些車輛屬性從車牌中提取字符。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1660

    文章

    22412

    瀏覽量

    636388
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136962

原文標題:機器學習加持,基于FPGA的高性能視覺應用方案設計

文章出處:【微信號:cirmall,微信公眾號:電路設計技能】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    深度解析瑞芯微RK182X系列:一款為AI機器視覺而生的高性能協處理器

    在 AI 與機器視覺技術飛速發展的當下,終端設備對算力、能效及兼容性的要求日益嚴苛。瑞芯微(Rockchip)于 2025 年推出的 RK182X 系列芯片,以 “高性能視覺協處理器”
    的頭像 發表于 02-09 16:44 ?1224次閱讀

    機器視覺網卡與普通網卡的5點關鍵不同

    隨著人工智能和工業自動化的蓬勃發展,機器視覺技術扮演著越來越重要的角色。機器視覺系統依賴于高質量的圖像數據進行分析和決策,而高性能的網絡傳輸
    的頭像 發表于 01-15 16:38 ?227次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>視覺</b>網卡與普通網卡的5點關鍵不同

    國產高性能ONFI IP解決方案全解析

    1. 什么是ONFI IP?其在AI時代的作用是什么?ONFI (Open NAND Flash Interface) 是連接閃存控制器與NAND顆粒的關鍵高速接口協議。在AI和高性能計算(HPC
    發表于 01-13 16:15

    FPGA+GPU異構混合部署方案設計

    為滿足對 “納秒級實時響應” 與 “復雜數據深度運算” 的雙重需求,“FPGA+GPU”異構混合部署方案通過硬件功能精準拆分與高速協同,突破單一硬件的性能瓶頸 ——FPGA聚焦低延遲實
    的頭像 發表于 01-13 15:20 ?358次閱讀

    機器視覺的核心技術和應用場景

    機器視覺正通過讓機器“看見”并解讀視覺數據來為行業帶來變革,進而提升自動化水平、質量控制效率與運營效能。本文將深入探討機器
    的頭像 發表于 12-29 16:32 ?905次閱讀

    AMD UltraScale架構:高性能FPGA與SoC的技術剖析

    AMD UltraScale架構:高性能FPGA與SoC的技術剖析 在當今的電子設計領域,高性能FPGA和MPSoC/RFSoC的需求日益增長。AMD的UltraScale架構憑借其創
    的頭像 發表于 12-15 14:35 ?561次閱讀

    Valens與 Imavix 聯手推出業界首款基于MIPI A-PHY 的機器視覺平臺,CIS 同步發布首款符合A-PHY標準的攝像頭

    ”Imavix”)宣布,推出業內首款量產級基于MIPI A-PHY的機器視覺平臺,用于在機器視覺領域實現高性能的 A-PHY 連接標準。該平
    的頭像 發表于 12-03 14:06 ?452次閱讀

    高精度機器人控制的核心——基于 MYD-LT536 開發板的精密運動控制方案

    人控制”應用中,系統必須具備高計算力、低延遲控制環路、實時反饋和多傳感器融合能力。 傳統的PLC或單片機方案在高并發計算與多軸同步控制方面往往性能不足,因此越來越多的工程師開始采用基于高性能SoC平臺
    發表于 11-14 15:48

    機器視覺檢測PIN針

    : 結合形態學處理、特征提?。ㄈ玳L寬比、面積)及深度學習(針對復雜缺陷),自動檢出彎曲、斷裂、變形、污染等。輸出與控制:實時顯示檢測結果(OK/NG)及具體參數數值。生成檢測報告,支持數據追溯。NG品自動剔除信號輸出,無縫對接產線。了解更多機器
    發表于 09-26 15:09

    Molex莫仕適用于高性能機器視覺系統的先進連接解決方案

    智能倉儲和智能制造需要優質攝像頭和照明傳感器,無論是在履行服務還是生產流程時,都能提供卓越的質量控制。連接領域的最新創新可提供高性能系統所需的高數據速率、無縫通信和堅固耐用性。Molex莫仕的組件
    的頭像 發表于 09-02 11:36 ?2616次閱讀

    FPGA機器學習中的具體應用

    隨著機器學習和人工智能技術的迅猛發展,傳統的中央處理單元(CPU)和圖形處理單元(GPU)已經無法滿足高效處理大規模數據和復雜模型的需求。FPGA(現場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發表于 07-16 15:34 ?2900次閱讀

    【「# ROS 2智能機器人開發實踐」閱讀體驗】視覺實現的基礎算法的應用

    閱讀心得體會:ROS2機器視覺與地圖構建技術 通過對本書第7章(ROS2視覺應用)和第8章(ROS2地圖構建)的學習,我對機器
    發表于 05-03 19:41

    **【技術干貨】Nordic nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合**

    【技術干貨】nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合 近期收到不少伙伴咨詢nRF54系列芯片的應用與技術細節,今天我們整理幾個核心問題與解答,帶你快速掌握如何在nRF54上部署AI
    發表于 04-01 00:00

    工業相機與采集卡配套方案:構建高性能機器視覺系統的核心要素

    機器視覺技術作為人工智能和智能制造的關鍵組成部分,正日益廣泛地應用于工業自動化、質量檢測、機器人引導等領域。而一套高性能機器
    的頭像 發表于 03-31 15:53 ?914次閱讀
    工業相機與采集卡配套<b class='flag-5'>方案</b>:構建<b class='flag-5'>高性能</b><b class='flag-5'>機器</b><b class='flag-5'>視覺</b>系統的核心要素

    德晟達高性能服務器助力工業機器視覺落地

    處理以及多模態數據融合。在此背景下,服務器集群作為核心算力基礎設施,其高性能計算、低延遲推理及高可靠性特性,已成為支撐工業機器視覺系統規模化部署的關鍵技術底座。
    的頭像 發表于 03-11 17:22 ?1141次閱讀