伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

沒你想的那么難 | 一文讀懂圖像分割

穎脈Imgtec ? 2023-05-16 09:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:圖靈Topia(ID:turingtopia)


圖像分割(Image Segmentation)是計算機視覺領域中的一項重要基礎技術,是圖像理解中的重要一環(huán)。近日,數(shù)據(jù)科學家Derrick Mwiti在一篇文章中,就什么是圖像分割、圖像分割架構、圖像分割損失函數(shù)以及圖像分割工具和框架等問題進行了討論,讓我們一探究竟吧。

42b820f2-f0a8-11ed-ba01-dac502259ad0.jpg


什么是圖像分割?

顧名思義,這是將一個圖像分割成多個片段的過程。在這個過程中,圖像中的每個像素都與一個對象類型相關聯(lián)。圖像分割主要有兩種類型:語義分割和實例分割。

在語義分割中,同一類型的所有對象都使用一個類標簽進行標記,而在實例分割中,相似的對象使用各自獨立的標簽。

42d13c4a-f0a8-11ed-ba01-dac502259ad0.jpg


圖像分割的體系結構

圖像分割的基本結構包括編碼器和解碼器。

42e5767e-f0a8-11ed-ba01-dac502259ad0.jpg編碼器通過過濾器從圖像中提取特征。解碼器負責生成最終的輸出,通常是一個包含對象輪廓的分割掩碼。大多數(shù)體系結構都有這種結構或其變體,看幾個例子:U-NetU-Net是最初用于分割生物醫(yī)學圖像的卷積神經(jīng)網(wǎng)絡。可視化時,其架構看起來像字母U,因此名稱為U-Net。它的體系結構由兩部分組成,左邊部分是收縮路徑,右邊部分是擴展路徑。收縮路徑的目的是捕獲上下文,而擴展路徑的作用是幫助精確定位。42f67d98-f0a8-11ed-ba01-dac502259ad0.jpgU-Net由右邊的擴展路徑和左邊的收縮路徑組成。收縮路徑由兩個3×3的卷積組成,卷積之后是一個整流的線性單元和一個用于降采樣的兩乘二最大池計算。

完整的U-Net實現(xiàn)可以在這里找到

https://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/

FastFCN —Fast Fully-connected network

在這種結構中,聯(lián)合金字塔上采樣(JPU)模塊被用來代替擴展卷積,因為它們消耗大量的內(nèi)存和時間。它的核心是一個全連接網(wǎng)絡,同時使用JPU進行上采樣。JPU將低分辨率特征圖提升為高分辨率特征圖。430ce98e-f0a8-11ed-ba01-dac502259ad0.jpg如果你想進行代碼實現(xiàn),鏈接如下:https://github.com/wuhuikai/FastFCNGated-SCNN該架構由雙流CNN架構組成。在此模型中,一個單獨的分支用于處理圖像形狀信息。形狀流用于處理邊界信息。432bab80-f0a8-11ed-ba01-dac502259ad0.jpg

你可以通過檢查這里的代碼來實現(xiàn):

https://github.com/nv-tlabs/gscnnDeepLab在這種結構中,卷積與上采樣濾波器用于涉及密集預測的任務。多個對象的分割是通過空間金字塔池來完成的。最后,用DCNNs改進對象邊界的定位。通過插入零點或?qū)斎胩卣鲌D進行稀疏采樣來對濾波器進行上采樣,從而實現(xiàn)空洞卷積。433f39f2-f0a8-11ed-ba01-dac502259ad0.jpg

可以在PyTorch或TensorFlow上嘗試其實現(xiàn)。

PyTorch:https://github.com/fregu856/deeplabv3

TensorFlow:https://github.com/sthalles/deeplab_v3

Mask R-CNN在這種體系結構中,使用bounding box和語義分割對對象進行分類和定位,并將每個像素分類為一組類別。每個感興趣的區(qū)域都有一個分割掩碼,最終的輸出是一個類標簽和一個bounding box。該體系結構是Faster R-CNN的擴展,F(xiàn)aster R-CNN由提出區(qū)域的深度卷積網(wǎng)絡和利用區(qū)域的檢測器組成。4358d8b2-f0a8-11ed-ba01-dac502259ad0.jpg這是在COCO測試集上得到的結果的圖像

43717f70-f0a8-11ed-ba01-dac502259ad0.jpg

圖像分割損失函數(shù)

語義分割模型在訓練過程中通常使用一個簡單的交叉熵損失函數(shù)。但是,如果對獲取圖像的粒度信息感興趣,則必須恢復到稍微高級一些的損失函數(shù),來看幾個例子:

Focal Loss

這種損失是對標準交叉熵準則的改進。這是通過改變其形狀來實現(xiàn)的,使得分配給分類良好的示例的損失權重降低了。最終,確保不存在類不平衡。

在這個損失函數(shù)中,交叉熵損失是會隨著縮放系數(shù)衰減為零而縮,訓練時,比例因數(shù)自動降低了簡單示例的權重,并將重點放在困難示例上。

43973ac6-f0a8-11ed-ba01-dac502259ad0.png

Dice loss

該損失是通過計算平滑dice coefficient函數(shù)獲得的。這種損失是最常用的損失,是分割問題。

43b12026-f0a8-11ed-ba01-dac502259ad0.png

Intersection over Union (IoU)-balanced Loss

IoU平衡分類損失的目的是增加高IoU樣本的梯度,降低低IoU樣本的梯度。從而提高了機器學習模型的定位精度。

43c8e6e8-f0a8-11ed-ba01-dac502259ad0.png

Boundary loss

Boundary loss的一種變體應用于具有高度不平衡分段的任務。

這種損失的形式是空間輪廓而非區(qū)域上的距離度量。通過這種方式,它解決了高度不平衡的分割任務的區(qū)域損失所帶來的問題。

43e7d080-f0a8-11ed-ba01-dac502259ad0.png

Weighted cross-entropy

在交叉熵的一個變體中,所有正例均按一定系數(shù)加權。它用于涉及類不平衡的方案。

43fb2766-f0a8-11ed-ba01-dac502259ad0.png

Lovász-Softmaxloss

該損失基于子模塊損失的convex Lovasz擴展,對神經(jīng)網(wǎng)絡中的intersection-over-union loss進行了直接優(yōu)化。

441f09ba-f0a8-11ed-ba01-dac502259ad0.png其他值得一提的損失有:TopK loss:其目標是確保網(wǎng)絡在訓練過程中專注于困難樣本。Distance penalized CE loss:它將網(wǎng)絡引向難以分割的邊界區(qū)域。Sensitivity-Specificity (SS) loss:計算特異性和敏感性的均方差的加權和。Hausdorff distance(HD) loss:可從卷積神經(jīng)網(wǎng)絡估計Hausdorff距離。

這些是在圖像分割中使用的一些損失函數(shù)。了解更多,請查看

https://github.com/JunMa11/SegLoss。


圖像分割的數(shù)據(jù)集

Common Objects in COntext—Coco Dataset

COCO是一個大型的對象檢測、分割和字幕數(shù)據(jù)集。數(shù)據(jù)集包含91個類。它有25萬人,都有自己的關鍵點。它的下載大小是37.57 GiB。它包含80個對象類別。它在Apache 2.0的許可下可用,可以從這里下載。

http://cocodataset.org/#download

PASCAL Visual Object Classes (PASCAL VOC)

PASCAL有20個不同的類,9963張圖片。訓練/驗證集是一個2GB的tar文件。數(shù)據(jù)集可以從官方網(wǎng)站下載。

http://host.robots.ox.ac.uk/pascal/VOC/voc2012/

The Cityscapes Dataset

這個數(shù)據(jù)集包含城市場景的圖像。該方法可用于評價視覺算法在城市場景中的性能。數(shù)據(jù)集可以從這里下載。

https://www.cityscapes-dataset.com/downloads/

The Cambridge-driving Labeled Video Database?—?CamVid

這是一個基于動作的分割和識別數(shù)據(jù)集。它包含32個語義類。以下鏈接包含數(shù)據(jù)集的進一步說明和下載鏈接。

http://mi.eng.cam.ac.uk/research/projects/VideoRec/CamVid/


圖像分割框架

如果準備好了數(shù)據(jù)集,那么來談談一些可用于入門的工具/框架。FastAI庫:給定一個圖像,該庫能夠為圖像中的對象創(chuàng)建掩碼。Sefexa圖像分割工具:可用于半自動圖像分割,圖像分析和創(chuàng)建地面實況。Deepmask:Facebook Research的Deepmask是DeepMask和SharpMask的Torch實現(xiàn)。MultiPath:這是一個Torch實現(xiàn),從“用于目標檢測的多路徑網(wǎng)絡”中提取目標檢測網(wǎng)絡。OpenCV :這是一個開放源代碼的計算機視覺庫,具有2500多種優(yōu)化算法。MIScnn:醫(yī)學圖像分割開源庫。它允許在幾行代碼中使用最新的卷積神經(jīng)網(wǎng)絡和深度學習模型建立管道。

Fritz:提供了多種計算機視覺工具,包括用于移動設備的圖像分割工具。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1096

    瀏覽量

    42412
  • 圖像分割
    +關注

    關注

    4

    文章

    182

    瀏覽量

    18818
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    讀懂愛芯元智2025年度報告

    讀懂愛芯元智2025年度報告
    的頭像 發(fā)表于 03-28 11:42 ?305次閱讀
    <b class='flag-5'>一</b>圖<b class='flag-5'>讀懂</b>愛芯元智2025年度報告

    全自動劃片機與半自動劃片機怎么選?讀懂選型關鍵

    全自動劃片機與半自動劃片機怎么選?讀懂選型關鍵在半導體封裝、LED制造、光伏電池加工等精密加工領域,劃片機作為實現(xiàn)晶圓、芯片等材料高精度切割的核心設備,其選型直接決定生產(chǎn)效率、產(chǎn)品良率及綜合
    的頭像 發(fā)表于 03-16 20:54 ?461次閱讀
    全自動劃片機與半自動劃片機怎么選?<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>選型關鍵

    讀懂MAX20733集成式降壓開關穩(wěn)壓器

    讀懂MAX20733集成式降壓開關穩(wěn)壓器 在當今電子設備對高性能、高效率電源的迫切需求下,款優(yōu)秀的開關穩(wěn)壓器至關重要。今天我們就來深入剖析
    的頭像 發(fā)表于 03-16 10:30 ?226次閱讀

    讀懂TUSS4440:變壓器驅(qū)動超聲波傳感器IC的極致應用

    讀懂TUSS4440:變壓器驅(qū)動超聲波傳感器IC的極致應用 作為電子工程師的我們,在設計工業(yè)超聲波應用系統(tǒng)時,總是在尋找高性能、功能豐富且易于集成的器件。今天要給大家詳細介紹款來
    的頭像 發(fā)表于 02-11 16:50 ?524次閱讀

    讀懂SDWAN:打破網(wǎng)絡壁壘,賦能企業(yè)數(shù)字化轉型——附云邊云科技實踐解析

    種更高效、靈活、經(jīng)濟的網(wǎng)絡解決方案。而SDWAN(軟件定義廣域網(wǎng))的出現(xiàn),正是為了解決這些難題,成為企業(yè)數(shù)字化轉型的“網(wǎng)絡基石”。今天,我們就用通俗的語言,讀懂S
    的頭像 發(fā)表于 02-09 14:51 ?731次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>SDWAN:打破網(wǎng)絡壁壘,賦能企業(yè)數(shù)字化轉型——附云邊云科技實踐解析

    SAM(通用圖像分割基礎模型)丨基于BM1684X模型部署指南

    前言SAM是Meta提出的分割切的提示型模型,其在1100萬張圖像上訓練了超過10億個掩碼,實現(xiàn)了強大的零樣本泛化,突破了分割界限。本
    的頭像 發(fā)表于 01-12 16:17 ?416次閱讀
    SAM(通用<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>基礎模型)丨基于BM1684X模型部署指南

    國產(chǎn)AI芯片:走而正確的路

    ”在哪里?芯片的“三重門”第重門:技術縱深之難AI芯片設計不是畫張圖紙那么簡單。從架構定義到RTL實現(xiàn),從物理設計到流片驗證,任何
    的頭像 發(fā)表于 12-23 16:30 ?682次閱讀
    國產(chǎn)AI芯片:走<b class='flag-5'>一</b>條<b class='flag-5'>難</b>而正確的路

    誰說網(wǎng)關做?用樂鑫科技ESP32-P4C5開發(fā)板,小白也能搞定專業(yè)級方案!啟明云端樂鑫代理

    “什么?你想自己搭建個家庭智能網(wǎng)關?”“別鬧了吧!協(xié)議復雜、硬件搞、代碼難題,兩三個月下不來的!”以上是不是你做家庭網(wǎng)關項目時的境況?不要急!傳統(tǒng)做家庭網(wǎng)關當然是這樣!但如果你手
    的頭像 發(fā)表于 12-04 18:02 ?796次閱讀
    誰說網(wǎng)關<b class='flag-5'>難</b>做?用樂鑫科技ESP32-P4C5開發(fā)板,小白也能搞定專業(yè)級方案!啟明云端樂鑫代理

    讀懂:CWDM和DWDM的核心差異

    光纖通信里的“兩兄弟”CWDM和DWDM,名字只差個字母,差別可大了去!今天講透核心差異,小易幫你快速分清~
    的頭像 發(fā)表于 09-17 18:19 ?1373次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>:CWDM和DWDM的核心差異

    手機板 layout 走線跨分割問題

    初學習layout時,都在說信號線不可跨分割,但是在工作中為了成本不能跨分割似乎也非絕對。 在后續(xù)工作中,跨分割的基礎都是相鄰層有面完整的GND參考,跨
    發(fā)表于 09-16 14:56

    讀懂 PWM控制背光亮度原理

    關于PWM控制背光亮度原理的詳細介紹 讀懂PWM調(diào)光:為何你的屏幕亮度可隨心而變? 你是否曾好奇,手機或電腦屏幕的亮度是如何從最暗無級調(diào)整到最亮的?這背后的魔法,主要歸功于項名為
    發(fā)表于 09-03 08:48

    迅為RK3576開發(fā)板攝像頭實時推理測試-ppseg?圖像分割

    迅為RK3576開發(fā)板攝像頭實時推理測試-ppseg 圖像分割
    的頭像 發(fā)表于 07-11 14:31 ?987次閱讀
    迅為RK3576開發(fā)板攝像頭實時推理測試-ppseg?<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>

    【正點原子STM32MP257開發(fā)板試用】基于 DeepLab 模型的圖像分割

    是谷歌團隊提出的種用于語義分割的深度學習模型,屬于 DeepLab 系列模型的第三代版本。它在圖像語義分割任務中表現(xiàn)優(yōu)異,能夠高效地捕獲圖像
    發(fā)表于 06-21 21:11

    讀懂圖像采集卡是什么?它在工業(yè)/醫(yī)療/監(jiān)控等多領域中的作用

    你有沒有想過,在工業(yè)檢測、醫(yī)院手術室、安防監(jiān)控這些高精度影像場景中,圖像是怎么被“抓”進電腦里進行分析處理的?單靠攝像頭就能搞定嗎?其實并沒那么簡單,真正起到關鍵作用的,是種常被忽視但極其重要的設備——
    的頭像 發(fā)表于 05-13 13:35 ?2383次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>!<b class='flag-5'>圖像</b>采集卡是什么?它在工業(yè)/醫(yī)療/監(jiān)控等多領域中的作用

    讀懂德明利2024年度報告

    讀懂德明利2024年度報告
    的頭像 發(fā)表于 04-25 22:42 ?756次閱讀
    <b class='flag-5'>一</b>圖<b class='flag-5'>讀懂</b>德明利2024年度報告