国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

圖像分割的背景知識

新機器視覺 ? 來源:新機器視覺 ? 作者:新機器視覺 ? 2020-12-28 14:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導讀

一個很好的入門小短文,內容很全,適合上手。

在這篇文章中,我們將進入使用深度學習進行圖像分割的世界。我們將討論:

圖像分割是什么以及圖像分割的兩種主要類型

圖像分割結構

圖像分割中使用的損失函數

你可以使用的框架

就讓我們一探究竟吧。

什么是圖像分割?

顧名思義,這是將圖像分割為多個部分的過程。在這個過程中,圖像中的每個像素都與一個對象類型相關聯。圖像分割主要有兩種類型:語義分割和實例分割。

在語義分割中,所有相同類型的對象都使用一個類標簽進行標記,而在實例分割中,相似的對象使用各自的標簽。

圖像分割結構

圖像分割的基本結構包括編碼器和解碼器。

編碼器通過濾波器從圖像中提取特征。解碼器負責生成最終輸出,該輸出通常是包含對象輪廓的分割掩碼。大多數架構都有這種架構或它的變體。

讓我們來看幾個例子。

U-Net

U-Net是一種卷積神經網絡,最初是為分割生物醫學圖像而開發的。當它被可視化的時候,它的架構看起來像字母U,因此被命名為U-Net。其體系結構由兩部分組成,左側為收縮路徑,右側為擴展路徑。收縮路徑的目的是獲取上下文,而擴展路徑的作用是幫助精確定位。

U-Net是由右側的擴張路徑和左側的收縮路徑組成的。收縮路徑由兩個3乘3的卷積組成。卷積之后是一個ReLU和一個2x2的最大池計算用于下采樣。

你可以在這里找到U-Net的完整實現:https://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/。

FastFCN —Fast Fully-connected network

在這個架構中,使用一個聯合金字塔上采樣(JPU)模塊來替換膨脹卷積,因為它們消耗大量的內存和時間。在應用JPU進行上采樣時,其核心部分采用全連接網絡。JPU將低分辨率的feature map采樣到高分辨率feature map。

如果你想動手實現一些代碼,看這里:https://github.com/wuhuikai/FastFCN。

Gated-SCNN

這個架構由一個 two-stream CNN架構組成。在該模型中,使用一個單獨的分支來處理圖像的形狀信息。利用形狀流來處理邊界信息。

實現參考代碼:https://github.com/nv-tlabs/gscnn

DeepLab

在這種架構中,上采樣濾波器的卷積用于涉及密集預測的任務。多尺度的目標分割是通過空間金字塔池實現的。最后,利用DCNNs來改進目標邊界的定位。通過對濾波器插入零進行上采樣或對輸入特征圖進行稀疏采樣來實現卷積。

實現參考代碼:https://github.com/fregu856/deeplabv3,https://github.com/sthalles/deeplab_v3

Mask R-CNN

在這個架構中,使用邊界框和語義分割將每個像素劃分為一組類別,對對象進行分類和局部化。對每個感興趣的區域得到一個分割掩碼,生成一個類標簽和一個邊界框作為最終輸出。該架構是Faster R-CNN的擴展。Faster R-CNN由regions proposer和深度卷積網絡和利局部檢測器組成。

這里是COCO測試集中的一張圖像的結果:

圖像分割損失函數

語義分割模型在訓練過程中通常使用一個簡單的交叉分類熵損失函數。但是,如果你對獲取圖像的細粒度信息感興趣,那么你需要用到稍微高級一點的損失函數。

我們來看看其中的幾個。

Focal Loss

這種損失是對標準交叉熵的改進。這是通過改變它的形狀來實現的,這樣分配給分類良好的樣本的損失就降低了。最終,這確保了沒有類別不平衡。在這個損失函數中,交叉熵損失被縮放,隨著對正確類的置信度的增加,縮放因子衰減為零。在訓練時,比例因子會自動降低簡單樣本的權重,并聚焦于困難樣本。

30040146-29d7-11eb-a64d-12bb97331649.png

Dice loss

這個損失是通過計算smooth dice coefficient得到的。這種損失是最常用的分割損失。

30239088-29d7-11eb-a64d-12bb97331649.png

Intersection over Union (IoU)-balanced Loss

IoU平衡分類損失的目的是增加高IoU樣本的梯度,降低低IoU樣本的梯度。這樣提高了機器學習模型的定位精度。

3043a8c8-29d7-11eb-a64d-12bb97331649.png

Boundary loss

邊界損失的一種變體應用于分割高度不平衡的任務。這種損失的形式是空間等高線上的距離度量,而不是區域。這種方法解決了高度不平衡的分割任務中區域損失的問題。

30610a12-29d7-11eb-a64d-12bb97331649.png

Weighted cross-entropy

在交叉熵的一種變體中,所有正樣本都用一定的系數進行加權。它用于類別不平衡的場景。

30773f26-29d7-11eb-a64d-12bb97331649.png

Lovász-Softmax loss

該損失是對基于子模塊損失凸Lovasz擴展的神經網絡平均IoU損失的直接優化。

309a68fc-29d7-11eb-a64d-12bb97331649.png

其他值得一提的損失包括:

TopK loss,其目的是確保網絡在訓練過程中聚焦于困難樣本上。

距離懲罰交叉熵損失,引導網絡難以分割的邊界地區。

敏感性-特異性(SS)損失,計算特異性和敏感性的均方差的加權和。

Hausdorff distance(HD) loss,估計了卷積神經網絡的Hausdorff距離。

這只是在圖像分割中使用的幾個損失函數。想了解更多內容,看這里:https://github.com/JunMa11/SegLoss。

圖像分割數據集

從哪里可以得到一些數據集來開始?讓我們來看幾個例子。

Common Objects in COntext?—?Coco Dataset

COCO是一個大型物體檢測、分割和圖像描述數據集。數據集包含91個類。它有25萬個人標注了關鍵點。它的大小是37.57 GiB。它包含80個物體類別。它遵循Apache 2.0許可,下載鏈接:http://cocodataset.org/#download。

PASCAL Visual Object Classes (PASCAL VOC)

PASCAL有9963個圖像和20個不同的類。訓練/驗證集是一個2GB的tar文件。數據集下載:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/。

The Cityscapes Dataset

此數據集包含城市場景的圖像。它可以用來評估城市場景中視覺算法的性能。數據集下載:https://www.cityscapes-dataset.com/downloads/。

The Cambridge-driving Labeled Video Database?—?CamVid

這是一個基于運動的分割和識別數據集。它包含32個語義類。數據集下載:http://mi.eng.cam.ac.uk/research/projects/VideoRec/CamVid/。

圖像分割框架

現在你已經有了數據集,讓我們介紹一些工具/框架,你可以使用它們來開始。

FastAI library- 給定一幅圖像,該庫能夠創建該圖像中對象的mask。

Sefexa Image Segmentation Tool?- Sefexa是一個免費的工具,可以用于半自動圖像分割,圖像分析,創建ground truth

Deepmask- Deepmask由Facebook Research開發,是Deepmask和SharpMask的Torch實現。

MultiPath- 這是來源于A MultiPath Network for Object Detection的物體檢測網絡的Torch實現。

OpenCV- 這是一個開源的計算機視覺庫,有超過2500個優化算法。

MIScnn- 這是一個醫學圖像分割開源庫。它使用最先進的卷積神經網絡和深度學習模型建立管道,只需幾行代碼。

Fritz- Fritz提供多種計算機視覺工具,包括用于移動設備的圖像分割工具。

總結

本文為你提供了一些圖像分割的背景知識,并為你提供了一些工具和框架,可以用于入門。

我們討論了:

什么是圖像分割,

圖像分割架構,

圖像分割損失,

圖像分割工具和框架。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107768
  • 圖像分割
    +關注

    關注

    4

    文章

    182

    瀏覽量

    18776
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26194

原文標題:圖像分割2020總結:結構,損失函數,數據集和框架

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    利用ExecuTorch和Arm SME2加速端側機器學習推理

    貼紙、分離主體以替換背景,或是對圖像局部進行選擇性增強。這些效果背后,是輕量級分割模型在運行,這些模型通過 ExecuTorch(PyTorch 的開源端側推理運行時)以及第二代 Arm 可伸縮矩陣擴展技術 (Arm SME2)
    的頭像 發表于 03-03 10:27 ?332次閱讀
    利用ExecuTorch和Arm SME2加速端側機器學習推理

    SAM(通用圖像分割基礎模型)丨基于BM1684X模型部署指南

    前言SAM是Meta提出的一個分割一切的提示型模型,其在1100萬張圖像上訓練了超過10億個掩碼,實現了強大的零樣本泛化,突破了分割界限。本例程對SAM官方開源倉庫的模型和算法進行移植,使之能
    的頭像 發表于 01-12 16:17 ?305次閱讀
    SAM(通用<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>基礎模型)丨基于BM1684X模型部署指南

    圖像采集卡終極指南:從原理到選型

    視覺系統的運行效率。本文將從技術原理、核心分類、關鍵參數、主流應用到實操選型,全方位拆解圖像采集卡,幫你形成完整的知識體系與選型邏輯。一、底層原理:圖像采集卡如何
    的頭像 發表于 11-19 15:54 ?596次閱讀
    <b class='flag-5'>圖像</b>采集卡終極指南:從原理到選型

    傳音TEX AI團隊斬獲ICCV 2025大型視頻目標分割挑戰賽雙料亞軍

    近日,國際計算機視覺大會(ICCV 2025)舉辦了第七屆大型視頻目標分割挑戰賽(LSVOS Challenge),傳音TEX AI團隊憑借自主研發的創新技術方案,在復雜視頻目標分割和語言指引視頻
    的頭像 發表于 10-31 09:42 ?558次閱讀
    傳音TEX AI團隊斬獲ICCV 2025大型視頻目標<b class='flag-5'>分割</b>挑戰賽雙料亞軍

    使用Otsu閾值算法將灰度圖像二值化

    還是純白,即利用此閾值將原圖像分成前景、背景兩個圖象。不同閾值對于前景和背景圖象的劃分不同,一般來說,前景和背景圖象的差別越大,表明劃分的效果越好。在 Otsu 算法中,以類間方差來衡
    發表于 10-28 06:49

    手機板 layout 走線跨分割問題

    初學習layout時,都在說信號線不可跨分割,但是在工作中為了成本不能跨分割似乎也非絕對。 在后續工作中,跨分割的基礎都是相鄰層有一面完整的GND參考,跨分割發生在相鄰的另外一層。 但
    發表于 09-16 14:56

    迅為RK3576開發板攝像頭實時推理測試-ppseg?圖像分割

    迅為RK3576開發板攝像頭實時推理測試-ppseg 圖像分割
    的頭像 發表于 07-11 14:31 ?870次閱讀
    迅為RK3576開發板攝像頭實時推理測試-ppseg?<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>

    如何將32個步進伺服驅動器塞進小型板材分割機中?

    板材分割機是工業制造中常見的裝備。機器的內部空間狹小,如何將多達32個步進伺服驅動器安裝在其中顯得非常困難。本文將通過基于EtherCAT總線的插板式步進伺服驅動器剖析其破解之法!傳統銑刀式板材分割
    的頭像 發表于 07-08 11:37 ?540次閱讀
    如何將32個步進伺服驅動器塞進小型板材<b class='flag-5'>分割</b>機中?

    【正點原子STM32MP257開發板試用】基于 DeepLab 模型的圖像分割

    【正點原子STM32MP257開發板試用】圖像分割 本文介紹了正點原子 STM32MP257 開發板基于 DeepLab 模型實現圖像分割的項目設計。 DeepLab 模型 DeepL
    發表于 06-21 21:11

    【AIBOX 應用案例】通過 U2-Net 實現背景移除

    設計,高效散熱,保障在高溫運行狀態下的運算性能和穩定性,滿足各種工業級的應用需求。應用案例:背景移除BackgroundRemoval(背景移除)技術已成為圖像處理
    的頭像 發表于 06-11 16:32 ?658次閱讀
    【AIBOX 應用案例】通過 U2-Net 實現<b class='flag-5'>背景</b>移除

    多光譜圖像技術在苗期作物與雜草識別中的研究進展

    、勞動強度大、完全依賴人工主體的經驗與知識,在大面積雜草苗情觀測上,人工識別是無能為力的。遙感識別法則克服了人工監測的諸多弊端,可以在短時間內獲得作物大范圍的圖像,自動識別田間雜草。 但是,由于遙感圖像的空間和
    的頭像 發表于 06-10 18:13 ?449次閱讀

    基于LockAI視覺識別模塊:C++圖像采集例程

    本文主要演示如何使用LockAI視覺識別模塊進行視頻流的讀取,同時使用Edit模塊進行圖像傳輸?;A知識講解1.1OpenCV簡介OpenCV(OpenSourceComputerVisionLibra
    的頭像 發表于 04-30 18:23 ?755次閱讀
    基于LockAI視覺識別模塊:C++<b class='flag-5'>圖像</b>采集例程

    如何修改yolov8分割程序中的kmodel?

    ;#039;''實驗平臺:01Studio CanMV K230說明:實現攝像頭圖像采集顯示-裂縫分割-寬度計算'''
    發表于 04-25 08:22

    國產替代進口圖像采集卡:機遇、挑戰與策略

    展現出獨特的優勢。本文將深入探討國產替代進口圖像采集卡的背景、機遇、挑戰以及相應的應對策略,旨在為推動該領域的發展提供參考。一、國產替代的背景與必要性多年來,進口
    的頭像 發表于 04-07 15:58 ?1052次閱讀
    國產替代進口<b class='flag-5'>圖像</b>采集卡:機遇、挑戰與策略

    labview調用yolo目標檢測、分割、分類、obb

    labview調用yolo目標檢測、分割、分類、obb、pose深度學習,支持CPU和GPU推理,32/64位labview均可使用。 (yolov5~yolov12)
    發表于 03-31 16:28