国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

算法 | 超Mask RCNN速度4倍,僅在單個GPU訓練的實時實例分割算法

WpOh_rgznai100 ? 來源:YXQ ? 2019-06-11 10:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在論文《YOLACT:Real-time Instance Segmentation》中,作者提出了一種簡潔的實時實例分割全卷積模型,僅使用單個 Titan Xp,以 33 fps 在MS COCO 上實現了 29.8 的 mAP,速度明顯優于以往已有的算法。而且,這個結果是就在一個 GPU 上訓練取得的!

引言

一開始,作者提出了一個疑問:創建實時實例分割算法需要什么?

在過去的幾年中,在實例分割方向取得了很大進展,部分原因是借鑒了物體檢測領域相關的技術。比如像 mask RCNN 和 FCIS 這樣的實例分割方法,是直接建立在像Faster R-CNN 和 R-FCN 這樣的物體檢測方法之上。然而,這些方法主要關注圖像性能,而較少出現 SSD,YOLO 這類關注實時性的實例分割算法。因此,本文的工作主要是來填補這一空白。SSD 這類方法是將 Two-Stage 簡單移除成為 One-Stage 方法,然后通過其它方式來彌補性能的損失。而這類方法在實例分割領域擴充起來卻并不容易,由于 Two-Stage 的方法高度依賴于特征定位來產生 mask,而這類方法不可逆。而 One-Stage 的方法,如 FCIS,由于后期需要大量的處理,因此也達不到實時。

YOLACT 介紹

基于此,作者在這項研究中提出一種放棄特征定位的方法——YOLACT(You Only Look At CoefficienTs)來解決實時性問題。

YOLACT 將實例分割分解為兩個并行任務:(1)在整副圖像上生成非局部原型 mask 的字典;(2)為每個實例預測一組線性組合系數。 從這兩部分內容生成全圖像實例分割的想法簡單:對于每個實例,使用預測的系數線性組合原型,然后用預測邊界框來 crop。作者通過這種方式來讓網絡學會如何定位實例mask本身,這些在視覺上,空間上和語義上相似的實例,在原型中卻不同。

作者發現,由于這個過程不依賴于 repooling,因此此方法可以產生高質量和高動態穩定性的 masks。盡管本文使用了全卷積網絡實現,但模板 mask 可以自己在具有平移變換情況下對實例進行定位。最后,作者還提出了 Fast NMS,這比標準 NMS 的快12ms,并且性能損失很小。

這種方法有是三個優點:第一,速度非常快。第二,由于沒使用類似“repool”的方法,mask的質量非常高。第三,這個想法可以泛化。生成原型和mask系數的想法可以添加到現有的目標檢測的算法里面。

算法

算法介紹

為了提高實例分割的速度,作者提出了一種快速、單階段的實例分割模型——YOLACT。主要思想是將 Mask 分支添加到單階段目標檢測框架中。因此,研究人員將實例分割任務分解為兩個更簡單的并行任務,將其組合以形成最終的 Mask。YOLACT 的網絡結構圖如下圖所示。

作者將實例分割的復雜任務分解為兩個更簡單的并行任務,這些任務可以組合以形成最終的 mask。 第一個分支使用 FCN 生成一組圖像大小的“原型掩碼”(prototype masks),它們不依賴于任何一個實例。第二個是給目標檢測分支添加額外的 head ,用于預測每個 anchor 的“掩碼系數”(mask coefficients)的向量,其中 anchor 是在編碼原型空間中的實例表示。最后,對經過NMS后的每個實例,本文通過線性組合這兩個分支來為該實例構造mask。

YOLACT 將問題分解為兩個并行的部分,利用 fc 層(擅長產生語義向量)和 conv 層(擅長產生空間相干掩模)來分別產生“掩模系數”和“原型掩模” 。因為原型和掩模系數可以獨立地計算,所以 backbone 檢測器的計算開銷主要來自合成(assembly)步驟,其可以實現為單個矩陣乘法。通過這種方式,論文中的方法可以在特征空間中保持空間一致性,同時仍然是 One-Stage 和快速的。

原型生成

原型生成分支是預測整個圖像的一組K個原型 mask。采用 FCN 來實現protonet ,其最后一層有 k 個 channels(每個原型一個)并將其附加到 backbone 特征層。

掩碼系數(mask coefficients)

在實驗中,YOLACT 為每個Anchor預測(4+C+k)個值,額外 k 個值即為 mask系數。另外,為了能夠通過線性組合得到 mask,很重要的一步是從最終的mask 中減去原型 mask。換言之,mask 系數必須有正有負。所以,在 mask系數預測時使用了 tanh 函數進行非線性激活,因為 tanh 函數的值域是(-1,1)。

合成Mask

為了生成實例掩模,通過基本的矩陣乘法配合 sigmoid 函數來處理兩分支的輸出,從而合成 mask。

其中,P 是 h×w×k 的原型 mask 集合;C 是 n×k 的系數集合,代表有 n 個通過 NMS 和閾值過濾的實例,每個實例對應有 k 個 mask 系數。

Loss 設計:Loss 由分類損失、邊界框回歸損失和 mask 損失三部分組成。其中分類損失和邊界框回歸損失同 SSD,mask 損失為預測 mask 和 ground truth mask 的逐像素二進制交叉熵。

Mask 裁剪:為了改善小目標的分割效果,在推理時會首先根據檢測框進行裁剪,再閾值化。而在訓練時,會使用 ground truth 框來進行裁剪,并通過除以對應 ground truth框面積來平衡 loss 尺度。

Emergent Behavior

在實例分割任務中,通常需要添加轉移方差。在 YOLACT 中唯一添加轉移方差的地方是使用預測框裁剪 feature map 時。但這只是為了改善對小目標的分割效果,作者發現對大中型目標,不裁剪效果就很好了。

Backbone 檢測器

因為預測一組原型 mask 和 mask 系數是一個相對比較困難的任務,需要更豐富更高級的特征,所以在網絡設計上,作者希望兼顧速度和特征豐富度。因此,YOLACT 的主干檢測器設計遵循了 RetinaNet 的思想,同時更注重速度。 YOLACT 使用 ResNet-101 結合 FPN 作為默認主干網絡,默認輸入圖像尺寸為550×550,如上圖所示。使用平滑-L1 loss 訓練 bounding box 參數,并且采用和 SSD 相同的 bounding box 參數編碼方式。 使用 softmax 交叉熵訓練分類部分,共(C+1)個類別。同時,使用 OHEM 方式選取訓練樣本,正負樣本比例設為 1:3. 值得注意的是,沒有像 RetinaNet 一樣采用 focal loss。

快速 NMS(fast NMS)

a.對每一類的得分前 n 名的框互相計算 IOU,得到 C*n*n 的矩陣X(對角矩陣),對每個類別的框進行降序排列。

b.其次,通過檢查是否有任何得分較高的框與其 IOU 大于某個閾值,從而找到要刪除的框,通過將 X 的下三角和對角區域設置為 0 實現。這可以在一個批量上三角中實現,之后保留列方向上的最大值,來計算每個檢測器的最大 IOU 矩陣 K。

c.最后,利用閾值 t(K

論文實驗

作者在 MS COCO 的 test-dev 數據集上對 YOLACT 和目前最好的方法進行了性能對比。本文的關注點在于速度的提升,且所有實驗都是在 Titan Xp 上進行的,故一些結果和原文中的結果可能略有不同。

實驗來驗證本文模型在不同大小輸入圖像情況下的性能。除了基本的 550×550 模型,還有輸入為 400×400 和 700×700 的模型,相應地也調整了 anchor 的尺寸(sx=s550/550*x s)。降低圖像大小會導致性能的大幅度下降,這說明越大的圖像進行實例分割的性能越好,但提升圖像尺寸帶來性能提升的同時會降低運行速度。

當然作者還做了關于 Mask 質量與視頻動態穩定性相關的對比實驗,并詳細分析了優劣緣由。詳見論文。

總結

YOLACT 網絡的優勢:快速,高質量的 mask,優良的動態穩定性。

YOLACT 網絡的劣勢:性能略低于目前最好的實例分割方法,很多由檢測引起的錯誤,分類錯誤和邊界框的位移等。

此外,作者最后還提到了該方法的一些典型錯誤:

1)定位誤差:當場景中一個點上出現多個目標時,網絡可能無法在自己的模板中定位到每個對象,此時將會輸出一些和前景 mask 相似的物體,而不是在這個集合中實例分割出一些目標。

2)特征泄露(Leakage):網絡對預測的集成 mask 進行了裁剪,但并未對輸出的結果進行去噪。這樣一來,當b-box 準確的時候,沒有什么影響,但是當 b-box 不準確的時候,噪聲將會被帶入實例 mask,造成一些“泄露”。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135425
  • 算法
    +關注

    關注

    23

    文章

    4784

    瀏覽量

    98038

原文標題:超Mask RCNN速度4倍,僅在單個GPU訓練的實時實例分割算法 | 技術頭條

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    SM4算法實現分享(一)算法原理

    SM4分組加密算法采用的是非線性迭代結構,以字為單位進行加密、解密運算,每次迭代稱為一輪變換,每輪變換包括S盒變換、非線性變換、線性變換、合成變換。加解密算法與密鑰擴展都是采用32輪非線性迭代結構
    發表于 10-30 08:10

    SM4算法原理及分享1

    SM4算法是一種分組密碼算法。其分組長度為128bit,密鑰長度也為128bit。加密算法與密鑰擴展算法均采用32輪非線性迭代結構,以字(
    發表于 10-30 06:54

    國密系列算法簡介及SM4算法原理介紹

    所示: 非對稱加密算法:SM2算法可用于電子認證服務;SM9算法可用于各種互聯網新興應用。 對稱加密算法:SM1算法未公布,以IP核的形式
    發表于 10-24 08:25

    加密算法的應用

    ,加密和解密速度相對較慢,適用于數據量較小的場景,所以常用來傳輸對稱加密的密鑰。常見的非對稱加密算法包括RSA、ECC等。 4. 加密算法的應用場景 加密技術的應用場景非常廣
    發表于 10-24 08:03

    AES和SM4算法的可重構分析

    一、AES和SM4算法特點分析 基于前面幾篇分享,我們對AES和SM4算法流程有了較為清晰的認識,接下來對AES和SM4
    發表于 10-23 07:26

    模板驅動 無需訓練數據 SmartDP解決小樣本AI算法模型開發難題

    算法作為軟實力,其水平直接影響著目標檢測識別的能力。兩年前,慧視光電推出了零基礎的基于yolo系列算法架構的AI算法開發平臺SpeedDP,此平臺能夠通過數據驅動模型訓練,實現
    的頭像 發表于 09-09 17:57 ?1397次閱讀
    模板驅動  無需<b class='flag-5'>訓練</b>數據  SmartDP解決小樣本AI<b class='flag-5'>算法</b>模型開發難題

    PPEC電源DIY套件:圖形化算法編程,解鎖電力電子底層算法實踐

    : 無需深入復雜的代碼編寫,通過圖形化界面的模塊拖拽、參數設置和連線操作來實現自定義控制算法,實現對開關電源的精準控制和優化。 ▌動態調試優化: 算法調整后立即生效,實時觀測輸出紋波、動態響應
    發表于 08-14 11:30

    信號發生器如何與波束賦形算法配合優化?

    相鄰的連續波(CW)干擾,功率比目標信號高10-20dB,驗證算法的頻域濾波和空間隔離能力。 智能干擾:生成方向性干擾(如通過波束賦形將干擾能量集中到目標用戶方向),測試算法的動態波束調整速度(如毫秒
    發表于 08-08 14:41

    RK3576 yolo11-seg訓練部署教程

    1.yolov11-seg簡介yolov11-seg是YOLO(YouOnlyLookOnce)系列的最新成員,專為實時實例分割任務設計。它在保持YOLO家族高效推理速度的同時,通過創
    的頭像 發表于 07-25 15:21 ?1811次閱讀
    RK3576 yolo11-seg<b class='flag-5'>訓練</b>部署教程

    k210在線訓練算法是yolo5嗎?

    k210在線訓練算法是yolo5嗎
    發表于 06-16 08:25

    單片機項目實例:XPT2046觸摸屏芯片驅動與校準算法

    單片機項目實例:XPT2046觸摸屏芯片驅動與校準算法,推薦下載!
    發表于 06-09 22:24

    改進粒子群算法的永磁同步電機PID控制器

    采用粒子優化算法進行PID模糊控制訓練能提高永磁同步電機的控制精度,提出一種基于改進粒子群算法的永磁同步電機 PID控制方法,構建永磁同步電機PD模糊控制目標畫數,選擇電壓、轉矩、速度
    發表于 05-28 15:44

    RK3576 yolov11-seg訓練部署教程

    yolov11-seg 是YOLO(You Only Look Once)系列的最新成員,專為實時實例分割任務設計。它在保持YOLO家族高效推理速度的同時,通過創新的網絡結構和
    的頭像 發表于 04-16 09:43 ?2352次閱讀
    RK3576 yolov11-seg<b class='flag-5'>訓練</b>部署教程

    無法轉換TF OD API掩碼RPGA模型怎么辦?

    無法轉換重新訓練的 TF OD API 掩碼 RPGA 模型,該模型使用以下命令在 GPU 上工作: mo > --saved_model_dir
    發表于 03-06 06:44

    執行“mask_rcnn_demo.exe”時,無法找到帶有名稱的Blob:DetectionOutput是怎么回事?

    引用 將 ONNX* Mask R-CNN 模型轉換為 OpenVINO?文檔的中間表示。 已下載并轉換 mask_rcnn_R_50_FPN_1x 模型到 IR 執行命令
    發表于 03-05 07:10