国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

在賽靈思FPGA SoC平臺上使用VITIS AI加速人工智能應用

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Vaibhav Kothari ? 2022-11-22 14:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

VITIS 是一個用于開發軟件和硬件的統一軟件平臺,將 Vivado 和其他組件用于 Xilinx FPGA SoC 平臺,如 ZynqMP UltraScale+ 和 Alveo 卡。VITIS SDK的關鍵組件,VITIS AI運行時(VART),為在邊緣和云端部署終端ML/AI應用程序提供了一個統一的接口

機器學習中的推理是計算密集型的,需要高內存帶寬和高性能計算,以滿足各種終端應用的低延遲和高吞吐量需求。

維蒂斯人工智能工作流程

Xilinx Vitis AI 提供了一個工作流程,使用簡單的流程在 Xilinx 深度學習處理單元 (DPU) 上部署深度學習推理應用:

深度處理單元 (DPU) 是一個可配置的計算引擎,針對深度學習推理應用的卷積神經網絡進行了優化,并放置在可編程邏輯 (PL) 中。DPU 包含高效且可擴展的 IP 核,可進行定制以滿足許多不同應用的需求。DPU 定義自己的指令集,Vitis AI 編譯器生成指令。

VITIS AI編譯器以優化的方式安排指令,以獲得最大的效能。

在 Xilinx ZynqMP UltraScale+ SoC 平臺上運行任何 AI 應用程序的典型工作流程包括以下內容:

模型量化

模型編譯

模型優化(可選)

構建 DPU 可執行文件

構建軟件應用程序

集成 VITIS AI 統一 API

編譯和鏈接混合 DPU 應用程序

在 FPGA 上部署混合 DPU 可執行文件

人工智能量化器

AI 量化器是一種用于量化過程的壓縮工具,通過將 32 位浮點權重和激活轉換為定點 INT8。它可以在不丟失模型準確信息的情況下降低計算復雜性。定點模型需要更少的內存,因此提供比浮點實現更快的執行速度和更高的電源效率。

人工智能編譯器

AI 編譯器將網絡模型映射到高效的指令集和數據流。編譯器的輸入是量化的 8 位神經網絡,輸出是 DPU 內核 - 可執行文件將在 DPU 上運行。在這里,不支持的層需要部署在CPU中,或者可以自定義模型來替換和刪除那些不支持的操作。它還執行復雜的優化,如層融合、指令調度和片上存儲器的重用。

一旦我們能夠執行 DPU,我們需要使用 Vitis AI 統一的 API 來初始化數據結構,初始化 DPU,在 CPU 上實現 DPU 不支持的層,并根據需要在 PL/PS 上添加預處理和后處理。

人工智能優化器

憑借其模型壓縮技術,AI 優化器可以將模型復雜性降低 5-50 倍,同時對準確性的影響最小。這種深度壓縮將推理性能提升到一個新的水平。我們可以實現所需的稀疏性并將運行時間縮短 2.5 倍。

AI 分析器

AI 探查器可以幫助分析推理查找導致端到端管道瓶頸的注意事項。性能分析器為設計人員提供了 DPU/CPU/內存的通用時間線。此過程不會更改任何代碼,并且可以跟蹤函數并進行分析。

人工智能運行時

VITIS AI 運行時 (VART) 允許應用程序使用統一的高級運行時 API 進行邊緣和云部署,使其無縫且高效。一些主要功能包括:

異步作業提交

異步作業收集

C++Python 實現

多線程和多進程執行

Vitis AI還提供DSight,DExplorer,DDump和DLet等,用于各種任務執行。

DSight & DExplorer

DPU IP 為特定內核提供了多種配置,可根據網絡型號進行選擇。DSight 告訴我們每個 DPU 內核的利用率百分比。它還提供了調度程序的效率,以便我們可以調整用戶線程。還可以查看性能數字,例如每層和每個DPU節點的MOPS,運行時和內存帶寬。

Softnautics選擇 Xilinx ZynqMP UltraScale+ 平臺進行高性能和計算部署。它提供最佳的應用處理、高度可配置的 FPGA 加速功能,以及 VITIS SDK,以加速高性能 ML/AI 推理。我們針對的一個這樣的應用是用于 Covid-19 篩查的口罩檢測。其目的是根據各國政府對 Covid-19 預防措施指南的要求,部署多流推理,用于對戴口罩的人進行 Covid-19 篩查并實時識別違規行為。

我們準備了一個數據集并選擇了預先訓練的權重來設計一個用于掩模檢測和篩選的模型。我們通過TensorFlow框架訓練和修剪了我們的自定義模型。這是人臉檢測和面具檢測的兩階段部署。這樣獲得的訓練模型是通過前面章節中介紹的VITIS AI工作流程傳遞的。我們觀察到推理時間的速度是 CPU 的 10 倍。Xilinx 提供不同的調試工具和實用程序,在初始開發和部署過程中非常有用。在初始部署階段,我們沒有檢測到掩碼和非掩碼類別。我們嘗試將基于 PC 的推理輸出與一個名為 Dexplorer 的調試實用程序之一的輸出相匹配。但是,調試模式和根導致問題進一步調試。運行量化器后,我們可以使用更大的校準圖像、迭代和檢測來調整輸出,視頻饋送的準確率約為 96%。我們還嘗試使用 AI 分析器識別管道中的瓶頸,然后采取糾正措施通過各種方式消除瓶頸,例如使用 HLS 加速來計算后處理中的瓶頸。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1660

    文章

    22408

    瀏覽量

    636233
  • soc
    soc
    +關注

    關注

    40

    文章

    4576

    瀏覽量

    229115
  • 人工智能
    +關注

    關注

    1817

    文章

    50094

    瀏覽量

    265287
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    2025 CICAS AI Agent全球專項半決賽達實智能大廈成功舉辦

    2026年1月5日,由中國人工智能學會主辦的第三屆全國人工智能應用場景創新挑戰(簡稱:CICAS)AI Agent全球專項半決賽
    的頭像 發表于 01-07 14:17 ?433次閱讀

    2025 全國人工智能應用場景創新挑戰AI Agent全球專項線下半決賽新聞發布會在深圳召開

    12月10日下午,以“智啟未來,星耀深圳”為主題的2025全國人工智能應用場景創新挑戰AI Agent 全球專項線下半決賽新聞發布會在深圳召開。本次發布會由CICAS?
    的頭像 發表于 12-10 18:11 ?1189次閱讀
    2025 全國<b class='flag-5'>人工智能</b>應用場景創新挑戰<b class='flag-5'>賽</b><b class='flag-5'>AI</b> Agent全球專項<b class='flag-5'>賽</b>線下半決賽新聞發布會在深圳召開

    Sapphire SoC中RISC-V平臺級中斷控制器深度解析

    隨著 RISC -V處理器 FPGA 領域的廣泛應用,易 FPGA 的 Sapphire RISC-V 內核憑借軟硬核的靈活支持,為
    的頭像 發表于 11-08 09:35 ?7827次閱讀
    易<b class='flag-5'>靈</b><b class='flag-5'>思</b>Sapphire <b class='flag-5'>SoC</b>中RISC-V<b class='flag-5'>平臺</b>級中斷控制器深度解析

    AMD Vitis AI 5.1測試版現已開放下載

    AMD Vitis AI 5.1全新發布——新增了對 AMD Versal AI Edge 系列神經網絡處理單元( NPU )的支持。Vitis A
    的頭像 發表于 11-08 09:24 ?1306次閱讀

    AMD Vitis AI 5.1測試版發布

    AMD Vitis AI 5.1全新發布——新增了對 AMD Versal AI Edge 系列神經網絡處理單元 (NPU) 的支持。Vitis A
    的頭像 發表于 10-31 12:46 ?790次閱讀

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    我們所有的 SoC 都能用于邊緣人工智能。例子包括: 預測性維護和樓宇自動化系統 每個節點上進行本地數據分析的智能傳感器網絡 遙控器和可穿戴設備的動作和手勢識別 用于
    發表于 08-31 20:54

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    ,技術自主可控 如今這個科技競爭激烈的時代,國產化硬件的重要性不言而喻。比鄰星人工智能綜合實驗箱就做到了這一點,采用國產化硬件,積極推進全行業產業鏈上下游環節的國產化進程,把國產自主可控的軟硬件平臺
    發表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    ,技術自主可控 如今這個科技競爭激烈的時代,國產化硬件的重要性不言而喻。比鄰星人工智能綜合實驗箱就做到了這一點,采用國產化硬件,積極推進全行業產業鏈上下游環節的國產化進程,把國產自主可控的軟硬件平臺
    發表于 08-07 14:23

    超小型Neuton機器學習模型, 在任何系統級芯片(SoC)上解鎖邊緣人工智能應用.

    Neuton 是一家邊緣AI 公司,致力于讓機器 學習模型更易于使用。它創建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們將介紹
    發表于 07-31 11:38

    迅為RK3588開發板Linux安卓麒麟瑞芯微國產工業AI人工智能

    迅為RK3588開發板Linux安卓麒麟瑞芯微國產工業AI人工智能
    發表于 07-14 11:23

    深瞳亮相AICon 2025全球人工智能開發與應用大會

    此前,6月27-28日,由極客邦科技旗下InfoQ中國主辦的“AICon全球人工智能開發與應用大會”北京舉辦。作為行業領先的視覺AI公司,格深瞳受邀參會。
    的頭像 發表于 07-05 16:15 ?1469次閱讀

    Nordic收購 Neuton.AI 關于產品技術的分析

    示例和支持,方便開發者 Nordic 的各類芯片上實現高效的邊緣 AI 應用; 如果對這個AI人工智能應用感興趣,請評論區聯系我們.
    發表于 06-28 14:18

    開售RK3576 高性能人工智能主板

    芯片讓產品變得更加完美,被廣 泛的應用到 AI 服務器、人臉支付設備、安防、醫療、交通、金融、工控、智慧教育、智能零售等 等 AI 智能領域。由于其硬件
    發表于 04-23 10:55

    Cognizant將與NVIDIA合作部署神經人工智能平臺加速企業人工智能應用

    -Cognizant將與NVIDIA合作部署神經人工智能平臺加速企業人工智能應用 Cognizant將在關鍵增長領域提供解決方案,包括企業級AI
    的頭像 發表于 03-26 14:42 ?739次閱讀
    Cognizant將與NVIDIA合作部署神經<b class='flag-5'>人工智能</b><b class='flag-5'>平臺</b>,<b class='flag-5'>加速</b>企業<b class='flag-5'>人工智能</b>應用

    AI人工智能隱私保護怎么樣

    在當今科技飛速發展的時代,AI人工智能已經深入到我們生活的方方面面,從醫療診斷到交通調度,從教育輔助到娛樂互動,其影響力無處不在。然而,隨著AI人工智能的廣泛應用,其安全性問題也備受關
    的頭像 發表于 03-11 09:46 ?1198次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>人工智能</b>隱私保護怎么樣