久久mm,亚洲国产成人久久精品一区,国产成人三级一区二区在线

來源：圖靈Topia（ID：turingtopia）

圖像分割（Image Segmentation）是計算機視覺領域中的一項重要基礎技術，是圖像理解中的重要一環(huán)。近日，數(shù)據(jù)科學家Derrick Mwiti在一篇文章中，就什么是圖像分割、圖像分割架構、圖像分割損失函數(shù)以及圖像分割工具和框架等問題進行了討論，讓我們一探究竟吧。

什么是圖像分割?

顧名思義，這是將一個圖像分割成多個片段的過程。在這個過程中，圖像中的每個像素都與一個對象類型相關聯(lián)。圖像分割主要有兩種類型:語義分割和實例分割。

在語義分割中，同一類型的所有對象都使用一個類標簽進行標記，而在實例分割中，相似的對象使用各自獨立的標簽。

圖像分割的體系結構

圖像分割的基本結構包括編碼器和解碼器。

編碼器通過過濾器從圖像中提取特征。解碼器負責生成最終的輸出，通常是一個包含對象輪廓的分割掩碼。大多數(shù)體系結構都有這種結構或其變體，看幾個例子：U-NetU-Net是最初用于分割生物醫(yī)學圖像的卷積神經(jīng)網(wǎng)絡。可視化時，其架構看起來像字母U，因此名稱為U-Net。它的體系結構由兩部分組成，左邊部分是收縮路徑，右邊部分是擴展路徑。收縮路徑的目的是捕獲上下文，而擴展路徑的作用是幫助精確定位。U-Net由右邊的擴展路徑和左邊的收縮路徑組成。收縮路徑由兩個3×3的卷積組成，卷積之后是一個整流的線性單元和一個用于降采樣的兩乘二最大池計算。

完整的U-Net實現(xiàn)可以在這里找到

https://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/

FastFCN —Fast Fully-connected network

在這種結構中，聯(lián)合金字塔上采樣(JPU)模塊被用來代替擴展卷積，因為它們消耗大量的內(nèi)存和時間。它的核心是一個全連接網(wǎng)絡，同時使用JPU進行上采樣。JPU將低分辨率特征圖提升為高分辨率特征圖。如果你想進行代碼實現(xiàn)，鏈接如下：https://github.com/wuhuikai/FastFCNGated-SCNN該架構由雙流CNN架構組成。在此模型中，一個單獨的分支用于處理圖像形狀信息。形狀流用于處理邊界信息。

你可以通過檢查這里的代碼來實現(xiàn)：

https://github.com/nv-tlabs/gscnnDeepLab在這種結構中，卷積與上采樣濾波器用于涉及密集預測的任務。多個對象的分割是通過空間金字塔池來完成的。最后，用DCNNs改進對象邊界的定位。通過插入零點或?qū)斎胩卣鲌D進行稀疏采樣來對濾波器進行上采樣，從而實現(xiàn)空洞卷積。

可以在PyTorch或TensorFlow上嘗試其實現(xiàn)。

PyTorch：https://github.com/fregu856/deeplabv3

TensorFlow：https://github.com/sthalles/deeplab_v3

Mask R-CNN在這種體系結構中，使用bounding box和語義分割對對象進行分類和定位，并將每個像素分類為一組類別。每個感興趣的區(qū)域都有一個分割掩碼，最終的輸出是一個類標簽和一個bounding box。該體系結構是Faster R-CNN的擴展，F(xiàn)aster R-CNN由提出區(qū)域的深度卷積網(wǎng)絡和利用區(qū)域的檢測器組成。這是在COCO測試集上得到的結果的圖像

圖像分割損失函數(shù)

語義分割模型在訓練過程中通常使用一個簡單的交叉熵損失函數(shù)。但是，如果對獲取圖像的粒度信息感興趣，則必須恢復到稍微高級一些的損失函數(shù)，來看幾個例子：

Focal Loss

這種損失是對標準交叉熵準則的改進。這是通過改變其形狀來實現(xiàn)的，使得分配給分類良好的示例的損失權重降低了。最終，確保不存在類不平衡。

在這個損失函數(shù)中，交叉熵損失是會隨著縮放系數(shù)衰減為零而縮，訓練時，比例因數(shù)自動降低了簡單示例的權重，并將重點放在困難示例上。

Dice loss

該損失是通過計算平滑dice coefficient函數(shù)獲得的。這種損失是最常用的損失，是分割問題。

Intersection over Union (IoU)-balanced Loss

IoU平衡分類損失的目的是增加高IoU樣本的梯度，降低低IoU樣本的梯度。從而提高了機器學習模型的定位精度。

Boundary loss

Boundary loss的一種變體應用于具有高度不平衡分段的任務。

這種損失的形式是空間輪廓而非區(qū)域上的距離度量。通過這種方式，它解決了高度不平衡的分割任務的區(qū)域損失所帶來的問題。

Weighted cross-entropy

在交叉熵的一個變體中，所有正例均按一定系數(shù)加權。它用于涉及類不平衡的方案。

Lovász-Softmaxloss

該損失基于子模塊損失的convex Lovasz擴展，對神經(jīng)網(wǎng)絡中的intersection-over-union loss進行了直接優(yōu)化。

其他值得一提的損失有：TopK loss：其目標是確保網(wǎng)絡在訓練過程中專注于困難樣本。Distance penalized CE loss：它將網(wǎng)絡引向難以分割的邊界區(qū)域。Sensitivity-Specificity (SS) loss：計算特異性和敏感性的均方差的加權和。Hausdorff distance(HD) loss：可從卷積神經(jīng)網(wǎng)絡估計Hausdorff距離。

這些是在圖像分割中使用的一些損失函數(shù)。了解更多，請查看

https://github.com/JunMa11/SegLoss。

圖像分割的數(shù)據(jù)集

Common Objects in COntext—Coco Dataset

COCO是一個大型的對象檢測、分割和字幕數(shù)據(jù)集。數(shù)據(jù)集包含91個類。它有25萬人，都有自己的關鍵點。它的下載大小是37.57 GiB。它包含80個對象類別。它在Apache 2.0的許可下可用，可以從這里下載。

http://cocodataset.org/#download

PASCAL Visual Object Classes (PASCAL VOC)

PASCAL有20個不同的類，9963張圖片。訓練/驗證集是一個2GB的tar文件。數(shù)據(jù)集可以從官方網(wǎng)站下載。

http://host.robots.ox.ac.uk/pascal/VOC/voc2012/

The Cityscapes Dataset

這個數(shù)據(jù)集包含城市場景的圖像。該方法可用于評價視覺算法在城市場景中的性能。數(shù)據(jù)集可以從這里下載。

https://www.cityscapes-dataset.com/downloads/

The Cambridge-driving Labeled Video Database?—?CamVid

這是一個基于動作的分割和識別數(shù)據(jù)集。它包含32個語義類。以下鏈接包含數(shù)據(jù)集的進一步說明和下載鏈接。

http://mi.eng.cam.ac.uk/research/projects/VideoRec/CamVid/

圖像分割框架

如果準備好了數(shù)據(jù)集，那么來談談一些可用于入門的工具/框架。FastAI庫：給定一個圖像，該庫能夠為圖像中的對象創(chuàng)建掩碼。Sefexa圖像分割工具：可用于半自動圖像分割，圖像分析和創(chuàng)建地面實況。Deepmask：Facebook Research的Deepmask是DeepMask和SharpMask的Torch實現(xiàn)。MultiPath：這是一個Torch實現(xiàn)，從“用于目標檢測的多路徑網(wǎng)絡”中提取目標檢測網(wǎng)絡。OpenCV ：這是一個開放源代碼的計算機視覺庫，具有2500多種優(yōu)化算法。MIScnn：醫(yī)學圖像分割開源庫。它允許在幾行代碼中使用最新的卷積神經(jīng)網(wǎng)絡和深度學習模型建立管道。

Fritz：提供了多種計算機視覺工具，包括用于移動設備的圖像分割工具。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴