亚洲精品国产一区二区电影,国产高清在线精品一区二区三区 ,国产乱码精品一区二区三区为

本文首先將會對Vitis統一軟件平臺和Vitsi AI進行簡單介紹，然后介紹如何在KV260上部署DPU鏡像，最后在KV260 DPU鏡像上運行Vitis AI自帶的圖像分類示例。通過本文，你將會對Vitis軟件平臺、Vitsi AI架構有初步認識，并知道如何在KV260上快速體驗Vitsi AI圖像分類示例程序。

01一、背景簡介

開始本文的實操環節之前，這里我先介紹一些背景知識，分別是Vitis統一軟件平臺和Vitis AI。

1.1 Vitis 統一軟件平臺簡介

來自Xilinx官網的簡介，Vitis 統一軟件平臺包括：

全面的內核開發套件，可無縫構建加速應用

完整的硬件加速開源庫，針對 AMD FPGA 和 Versal 自適應 SoC 硬件平臺進行了優化

插入特定領域的開發環境，可直接在熟悉的更高層次框架中進行開發

不斷發展的硬件加速合作伙伴庫和預建應用生態系統

Vitis Model Composer 是一款基于模型的設計工具，不僅可在 MathWorks MATLAB 和 Simulink 環境中實現快速設計探索與驗證，而且還可加速 AMD 器件的生產進程。

Vitis Networking P4 允許創建軟定義網絡。VitisNetP4 數據平面構建器生成的系統可以針對從簡單的數據包分類到復雜的數據包編輯的各種數據包處理功能進行編程。

來自官網的Vitis統一軟件平臺架構圖：

從官網的介紹頁面我們也可以看到，Vitis 統一軟件平臺包括如下組件:

Vitis AI

Vitis 視頻分析SDK

Vitis 庫

Vitis HLS

Vitis Model Composer

今天我們將會重點介紹Vitis AI。

1.2 Vitsi AI簡介

本節內容主要參考了自官方github.io文檔。

AMD Vitis AI 是一個集成開發環境，可用于加速 AMD 平臺上的 AI 推理。該工具鏈提供優化的IP、工具、庫、模型以及資源，例如示例設計和教程，可在整個開發過程中為用戶提供幫助。它在設計時充分考慮了高效率和易用性，在 AMD 自適應 SoC 和 Alveo 數據中心加速卡上釋放了 AI 加速的全部潛力。

Vitis AI 解決方案由三個主要組件組成：

深度學習處理器單元（DPU），用于優化 ML 模型推理的硬件引擎。

模型開發工具，用于為 DPU 編譯和優化 ML 模型。

模型部署庫和 API，用于從軟件應用程序在 DPU 引擎上集成和執行 ML 模型。

Vitis AI 解決方案的打包和交付方式如下：

AMD 開放下載：集成 DPU 的預構建目標映像（以下簡稱“DPU鏡像”）

Vitis AI Docker容器：模型開發工具

Vitis AI github 存儲庫：模型部署庫、設置腳本、示例和參考設計

02二、部署DPU鏡像到KV260

2.1 下載DPU鏡像

在KV260開發板上正式體驗Vitis AI之前，需要將上一節中提到的DPU鏡像下載下來并燒錄到SD上。

支持KV260的最新DPU鏡像下載鏈接：https://china.xilinx.com/member/forms/download/design-license-xef.html?filename=xilinx-kv260-dpu-v2022.2-v3.0.0.img.gz

2.2 寫入DPU鏡像到SD卡

下載完成后，解壓壓縮包，通過Rufus將解壓的wic文件寫入SD卡。使用Rufus選擇文件時，需要注意將右側的默認文件類型修改為全部文件，否則默認不支持wic文件：

寫入過程顯示進度：

2.3 啟動DPU鏡像系統

完成DPU鏡像寫入SD卡后，將SD卡讀卡器從PC移除后，將SD卡插入到開發板，插好串口線，打開串口終端，波特率設置為115200，就可以準備上電開機了。

啟動之后會自動登錄root賬號（默認密碼為root）：

插上網線的話，啟動后還可以看到輸出了dashborad訪問鏈接：

根據ifconfig查看的IP地址，瀏覽器訪問dashboard鏈接，可以看到實時狀態監控：

03三、運行Vitsi AI圖像分類示例

3.1 DPU鏡像自帶的一些文件介紹

DPU鏡像默認帶有SSH服務，并且是開機啟動的，因此可以使用MobaXterm的SSH客戶端通過網絡登錄KV260，如下圖所示：

MobaXterm的SSH客戶端時帶有X11-forwarding功能的，支持將遠程程序界面通過SSH協議顯示在本地。

登錄系統后，可以看到，/home/root目錄下已經有了兩個目錄。

使用tree命令，可以看到Vitis-AI目錄結構：

接下來我們將會嘗試運行vai_runtime下的resnet50示例程序，我們先看看這個目錄下的文件結構：

里面有文件的作用分別為：

build.sh，編譯腳本，里面包含編譯src/main.cc的命令

resnet50，已經編譯好的可執行程序，由src/main.cc編譯生成

readme，說明文件

words.txt，分類標簽

src/main.cc，示例程序源碼

DPU鏡像默認已經安裝了gcc，直接運行build.sh就可以編譯src/main.cc，并生成resnet50可執行文件。可以嘗試將resnet50可執行文件刪除掉，再運行build.sh腳本，觀察是否重新生成了resnet50。

3.2 下載resnet50測試圖片

通過以下命令，下載并解壓resnet50測試圖片：

cd ~
wget https://china.xilinx.com/bin/public/openDownload?filename=vitis_ai_runtime_r3.0.0_image_video.tar.gz -O vitis_ai_runtime_r3.0.0_image_video.tar.gz
mkdir vitis_ai_runtime_r3.0.0_image_video
tar -C vitis_ai_runtime_r3.0.0_image_video -xzvf vitis_ai_runtime_r3.0.0_image_video.tar.gz

（左右移動查看全部內容）

3.3 運行resnet50示例程序

接下來，通過如下命令，運行resnet50示例程序：

cd ~/Vitis-AI/examples/vai_runtime/resnet50
./resnet50 /usr/share/vitis_ai_library/models/resnet50/resnet50.xmodel

（左右移動查看全部內容）

運行結果如下：

報錯說../images目錄找不到。

創建../images目錄，并將剛剛下載的resnet50測試圖片拷貝到該目錄中：

mkdir -v ../images
cp -vr ~/vitis_ai_runtime_r3.0.0_image_video/images/* ../images/

（左右移動查看全部內容）

運行輸出如下：

再次運行resnet50示例程序：

成功識別了。

命令行第二個參數 /usr/share/vitis_ai_library/models/resnet50/resnet50.xmodel 是resnet50的DPU模型文件，該文件在DPU鏡像中已經有了，因此不需要手動下載。

3.4 使用金魚圖片進行測試

words.txt 文件中是resnet50識別結果的分類標簽，可以看到前面幾行中包含金魚（goldfish）分類：

因此，可以找一個金魚圖片進行測試。

隨便找了一張：

通過MobaXterm左側邊欄的上傳功能傳到開發板上：

默認上傳位置為HOME目錄（~）。

接下來，將金魚圖片拷貝到../images目錄，并將原來的測試圖片刪除掉，重新運行resnet50示例程序，可以看到成功識別了金魚：

04四、示例程序源碼解讀

接下來我們看看resnet50目錄下的src/main.cc文件內容。

4.2 main函數

首先是main函數：

/**
 * [url=home.php?mod=space&uid=2666770]@Brief[/url] Entry for runing ResNet50 neural network
 *
 * [url=home.php?mod=space&uid=1902110]@NOTE[/url] Runner APIs prefixed with "dpu" are used to easily program &
 *    deploy ResNet50 on DPU platform.
 *
 */
int main(int argc, char* argv[]) {
 // Check args
 if (argc != 2) {
  cout << "Usage of resnet50 demo: ./resnet50 [model_file]" << endl;
 ? ?return -1;
 ?}
 ?auto graph = xir::deserialize(argv[1]);
 ?auto subgraph = get_dpu_subgraph(graph.get());
 ?CHECK_EQ(subgraph.size(), 1u)
 ? ? ?<< "resnet50 should have one and only one dpu subgraph.";
 ?LOG(INFO) << "create running for subgraph: " << subgraph[0]->get_name();
 /*create runner*/
 auto runner = vart::create_runner(subgraph[0], "run");
 // ai::XdpuRunner* runner = new ai::XdpuRunner("./");
 /*get in/out tensor*/
 auto inputTensors = runner->get_input_tensors();
 auto outputTensors = runner->get_output_tensors();


 /*get in/out tensor shape*/
 int inputCnt = inputTensors.size();
 int outputCnt = outputTensors.size();
 TensorShape inshapes[inputCnt];
 TensorShape outshapes[outputCnt];
 shapes.inTensorList = inshapes;
 shapes.outTensorList = outshapes;
 getTensorShape(runner.get(), &shapes, inputCnt, outputCnt);


 /*run with batch*/
 runResnet50(runner.get());
 return 0;
}

（左右移動查看全部內容）

其中:

auto graph = xir::deserialize(argv[1]); 用于加載模型

auto runner = vart::create_runner(subgraph[0], "run"); 用于創建Runner對象

auto inputTensors = runner->get_input_tensors(); 用于獲取輸入Tensor對象

auto outputTensors = runner->get_output_tensors(); 用于獲取輸出Tensor對象

最后的 runResnet50(runner.get()); 運行模型

4.2 runRestnet50函數

接下來我們看看runReset50函數：

/**
 * @brief Run DPU Task for ResNet50
 *
 * [url=home.php?mod=space&uid=3142012]@param[/url] taskResnet50 - pointer to ResNet50 Task
 *
 * [url=home.php?mod=space&uid=1141835]@Return[/url] none
 */
void runResnet50(vart::Runner* runner) {
 /* Mean value for ResNet50 specified in Caffe prototxt */
 vector kinds, images;


 /* Load all image names.*/
 ListImages(baseImagePath, images);
 if (images.size() == 0) {
  cerr << "
Error: No images existing under " << baseImagePath << endl;
 ? ?return;
 ?}


 ?/* Load all kinds words.*/
 ?LoadWords(wordsPath + "words.txt", kinds);
 ?if (kinds.size() == 0) {
 ? ?cerr << "
Error: No words exist in file words.txt." << endl;
 ? ?return;
 ?}
 ?float mean[3] = {104, 107, 123};


 ?/* get in/out tensors and dims*/
 ?auto outputTensors = runner->get_output_tensors();
 auto inputTensors = runner->get_input_tensors();
 auto out_dims = outputTensors[0]->get_shape();
 auto in_dims = inputTensors[0]->get_shape();


 auto input_scale = get_input_scale(inputTensors[0]);
 auto output_scale = get_output_scale(outputTensors[0]);


 /*get shape info*/
 int outSize = shapes.outTensorList[0].size;
 int inSize = shapes.inTensorList[0].size;
 int inHeight = shapes.inTensorList[0].height;
 int inWidth = shapes.inTensorList[0].width;


 int batchSize = in_dims[0];


 std::vector> inputs, outputs;


 vector imageList;
 int8_t* imageInputs = new int8_t[inSize * batchSize];


 float* softmax = new float[outSize];
 int8_t* FCResult = new int8_t[batchSize * outSize];
 std::vector inputsPtr, outputsPtr;
 std::vector> batchTensors;
 /*run with batch*/
 for (unsigned int n = 0; n < images.size(); n += batchSize) {
 ? ?unsigned int runSize =
 ? ? ? ?(images.size() < (n + batchSize)) ? (images.size() - n) : batchSize;
 ? ?in_dims[0] = runSize;
 ? ?out_dims[0] = batchSize;
 ? ?for (unsigned int i = 0; i < runSize; i++) {
 ? ? ?Mat image = imread(baseImagePath + images[n + i]);


 ? ? ?/*image pre-process*/
 ? ? ?Mat image2; ?//= cv::Mat(inHeight, inWidth, CV_8SC3);
 ? ? ?resize(image, image2, Size(inHeight, inWidth), 0, 0);
 ? ? ?for (int h = 0; h < inHeight; h++) {
 ? ? ? ?for (int w = 0; w < inWidth; w++) {
 ? ? ? ? ?for (int c = 0; c < 3; c++) {
 ? ? ? ? ? ?imageInputs[i * inSize + h * inWidth * 3 + w * 3 + c] =
 ? ? ? ? ? ? ? ?(int8_t)((image2.at(h, w)[c] - mean[c]) * input_scale);
     }
    }
   }
   imageList.push_back(image);
  }


  /* in/out tensor refactory for batch inout/output */
  batchTensors.push_back(std::shared_ptr(
    xir::create(inputTensors[0]->get_name(), in_dims,
              xir::DataType{xir::XINT, 8u})));
  inputs.push_back(std::make_unique(
    imageInputs, batchTensors.back().get()));
  batchTensors.push_back(std::shared_ptr(
    xir::create(outputTensors[0]->get_name(), out_dims,
              xir::DataType{xir::XINT, 8u})));
  outputs.push_back(std::make_unique(
    FCResult, batchTensors.back().get()));


  /*tensor buffer input/output */
  inputsPtr.clear();
  outputsPtr.clear();
  inputsPtr.push_back(inputs[0].get());
  outputsPtr.push_back(outputs[0].get());


  /*run*/
  auto job_id = runner->execute_async(inputsPtr, outputsPtr);
  runner->wait(job_id.first, -1);
  for (unsigned int i = 0; i < runSize; i++) {
 ? ? ?cout << "
Image : " << images[n + i] << endl;
 ? ? ?/* Calculate softmax on CPU and display TOP-5 classification results */
 ? ? ?CPUCalcSoftmax(&FCResult[i * outSize], outSize, softmax, output_scale);
 ? ? ?TopK(softmax, outSize, 5, kinds);
 ? ? ?/* Display the impage */
 ? ? ?bool quiet = (getenv("QUIET_RUN") != nullptr);
 ? ? ?if (!quiet) {
 ? ? ? ?cv::imshow("Classification of ResNet50", imageList[i]);
 ? ? ? ?cv::waitKey(10000);
 ? ? ?}
 ? ?}
 ? ?imageList.clear();
 ? ?inputs.clear();
 ? ?outputs.clear();
 ?}
 ?delete[] FCResult;
 ?delete[] imageInputs;
 ?delete[] softmax;
}

（左右移動查看全部內容）

其中，關鍵代碼行如下：

ListImages(baseImagePath, images); 用于列出../images目錄中的圖片文件

LoadWords(wordsPath + "words.txt", kinds); 用于讀取words.txt中的分類標簽

Mat image = imread(baseImagePath + images[n + i]); 用于讀取圖片

resize(image, image2, Size(inHeight, inWidth), 0, 0); 用于將圖片縮放為模型需要的尺寸

auto job_id = runner->execute_async(inputsPtr, outputsPtr); 開始異步執行模型推理

runner->wait(job_id.first, -1); 等待異步執行完成

cv::imshow("Classification of ResNet50", imageList[i]); 顯示圖片

cv::waitKey(10000); 等待鍵盤按鍵10秒

好了本篇內容就到這里了，感謝閱讀，下次再會。

審核編輯：湯梓紅

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

Xilinx

Xilinx

+關注

關注
73

文章
2202

瀏覽量
131519
AI

AI

+關注

關注
91

文章
40403

瀏覽量
301973
程序

程序

+關注

關注
117

文章
3846

瀏覽量
85346
圖像分類

圖像分類

+關注

關注
0

文章
97

瀏覽量
12517

原文標題：【試用報告】如何在KV260上快速體驗Vitsi AI圖像分類示例程序

文章出處：【微信號：gh_9b9470648b3c，微信公眾號：電子發燒友論壇】歡迎添加關注！文章轉載請注明出處。

伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

搜索歷史

如何在KV260上快速體驗Vitsi AI圖像分類示例程序

評論