国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖像分割技巧資料

新機(jī)器視覺(jué) ? 來(lái)源:機(jī)器之心 ? 2020-09-24 11:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一個(gè)經(jīng)歷了 39 場(chǎng) Kaggle 比賽的團(tuán)隊(duì)在 reddit 上發(fā)帖表示,他們整理了一份結(jié)構(gòu)化的圖像分割技巧列表,涵蓋數(shù)據(jù)增強(qiáng)、建模、損失函數(shù)、訓(xùn)練技巧等多個(gè)方面,不失為一份可以參考的圖像分割技巧資料。

圖像分割是圖像處理和計(jì)算機(jī)視覺(jué)的熱點(diǎn)之一,是根據(jù)圖像內(nèi)容對(duì)指定區(qū)域進(jìn)行標(biāo)記的計(jì)算機(jī)視覺(jué)任務(wù)。它基于某些標(biāo)準(zhǔn)將輸入圖像劃分為多個(gè)相同的類(lèi)別,簡(jiǎn)言之就是「這張圖片里有什么,其在圖片中的位置是什么?」以便提取人們感興趣的區(qū)域。圖像分割是圖像分析和圖像特征提取及識(shí)別的基礎(chǔ)。

圖像分割也是 Kaggle 中的一類(lèi)常見(jiàn)賽題,比如衛(wèi)星圖像分割與識(shí)別、氣胸疾病圖像分割等。除了密切的團(tuán)隊(duì)配合、給力的 GPU 配置等條件,技巧在這類(lèi)比賽中也發(fā)揮了很大的作用。但這些技巧去哪里找呢?Medium、大牛博客、參賽經(jīng)驗(yàn)帖中都散落著各種技巧分享,但這些資源往往比較零散,于是就有人想到,為什么不把它們集中到一起呢? Derrick Mwiti 就帶頭做了這么一件事,他和他所在的團(tuán)隊(duì)將過(guò)去 39 場(chǎng) Kaggle 比賽中討論過(guò)的圖像分割技巧、資料都匯總到了一起,希望可以幫到在圖像分割任務(wù)中遇到困難的同學(xué)。 這份列表分為十大板塊,包括外部數(shù)據(jù)、預(yù)處理、數(shù)據(jù)增強(qiáng)、建模、硬件配置、損失函數(shù)、訓(xùn)練技巧、評(píng)估和交叉驗(yàn)證、集成方法以及后處理。

每個(gè)版塊的具體內(nèi)容以條目的形式呈現(xiàn),每個(gè)條目又都嵌入了一些鏈接,點(diǎn)開(kāi)可以看到一些優(yōu)秀的 Kaggle 解決方案分享、Medium 博客教程、高贊的 GitHub 項(xiàng)目等,讀者可以根據(jù)自己的具體問(wèn)題和需要進(jìn)行查找。 本文選取了其中一部分內(nèi)容進(jìn)行介紹,具體細(xì)節(jié)及鏈接請(qǐng)參見(jiàn)原文。 接下來(lái),我們來(lái)看每個(gè)步驟都有哪些技巧吧。 預(yù)處理 這一部分包含眾多常見(jiàn)的有效圖像預(yù)處理方法,例如:

使用高斯差分方法進(jìn)行斑點(diǎn)檢測(cè);

使用基于圖像塊的輸入進(jìn)行訓(xùn)練,以減少訓(xùn)練時(shí)間;

加載數(shù)據(jù)時(shí),用 cudf 替換 Pandas;

確保所有圖像保持相同的方向;

使用 OpenCV 對(duì)所有常規(guī)圖像進(jìn)行預(yù)處理;

采用自主學(xué)習(xí)并手動(dòng)添加注釋?zhuān)?/p>

將所有圖像調(diào)整成相同的分辨率,以便將相同的模型用于不同厚度的掃描等。

數(shù)據(jù)增強(qiáng) 數(shù)據(jù)增強(qiáng)能夠使網(wǎng)絡(luò)具有更復(fù)雜的表征能力,從而減小網(wǎng)絡(luò)性能在驗(yàn)證集和訓(xùn)練集以及最終測(cè)試集上的差距,讓網(wǎng)絡(luò)更好地學(xué)習(xí)遷移數(shù)據(jù)集上的數(shù)據(jù)分布。這部分介紹了一些常用的數(shù)據(jù)增強(qiáng)方法:

用 albumentations 包進(jìn)行數(shù)據(jù)增強(qiáng);

使用 90 度隨機(jī)旋轉(zhuǎn);

使用水平、垂直翻轉(zhuǎn)或這兩個(gè)方向都做翻轉(zhuǎn);

嘗試進(jìn)行復(fù)雜的幾何變換,包括彈性變換、透視變換、分段仿射變換、枕形失真;

應(yīng)用隨機(jī) HSV;

使用損失較小的增強(qiáng)數(shù)據(jù)進(jìn)行泛化,以防止有用圖像信息丟失;

應(yīng)用通道 shuffle;

根據(jù)類(lèi)別頻率進(jìn)行數(shù)據(jù)擴(kuò)充;

應(yīng)用高斯噪聲等。

建模網(wǎng)絡(luò)架構(gòu) 這一部分介紹了一些可用在圖像分割上的常用網(wǎng)絡(luò)框架,例如:

使用基于 U-net 的架構(gòu);

用 inception-ResNet v2 架構(gòu)得到具備不同感受野的訓(xùn)練特征;

經(jīng)過(guò)對(duì)抗訓(xùn)練的 Siamese 網(wǎng)絡(luò);

以密集(FC)層作為最后一層的 ResNet50、Xception、Inception ResNet v2 x 5;

使用全局最大池化層,無(wú)論輸入尺寸如何,該層都將返回固定長(zhǎng)度的輸出;

使用堆疊的膨脹卷積;

VoxelNet;

用 concat 和 conv1x1 替換 LinkNet 跳躍連接中的加號(hào);

廣義平均池化;

用 3D 卷積網(wǎng)絡(luò)在圖像上滑動(dòng);

使用在 Imagenet 數(shù)據(jù)集上預(yù)訓(xùn)練的 ResNet152 作為特征提取器等。

以及下列經(jīng)典網(wǎng)絡(luò)框架:

損失函數(shù) 損失函數(shù)常用來(lái)估計(jì)模型預(yù)測(cè)結(jié)果與真值之間的差距。選擇合適的損失函數(shù),對(duì)模型效果很重要。 這部分介紹了一系列損失函數(shù)和使用場(chǎng)景,例如:

dice 系數(shù):能夠很好地處理不平衡數(shù)據(jù);

加權(quán)邊界損失:減少預(yù)測(cè)分割與真值之間的距離;

MultiLabelSoftMarginLoss:基于最大熵優(yōu)化多標(biāo)簽一對(duì)多損失的標(biāo)準(zhǔn);

具備 logit 損失的平衡交叉熵(Balanced cross entropy,BCE):以特定系數(shù)權(quán)衡正例和負(fù)例;

……

此外,作者還介紹了 Arc margin 損失、BCE 和 dice 系數(shù)的組合等等,更多詳情參見(jiàn)原文。

訓(xùn)練技巧 這部分介紹了常用的模型訓(xùn)練技巧,如:

嘗試不同的學(xué)習(xí)率;

嘗試不同批大小;

使用帶有動(dòng)量項(xiàng)的 SDG,并且手動(dòng)設(shè)置學(xué)習(xí)率衰減;

數(shù)據(jù)增強(qiáng)過(guò)多會(huì)降低準(zhǔn)確率;

使用裁剪后的圖像訓(xùn)練,并在完整的圖像上做預(yù)測(cè);

在學(xué)習(xí)速率調(diào)整上使用 Keras 中的 ReduceLROnPlateau() 方法;

凍結(jié)除了最后一層以外所有的網(wǎng)絡(luò)層,并使用 Stage1 中的 1000 張圖片進(jìn)行模型微調(diào);

開(kāi)發(fā)一個(gè)能使標(biāo)簽更加均勻的采樣器;

使用類(lèi)別感知采樣(class aware sampling)等。

評(píng)估和交叉驗(yàn)證 這部分介紹了 k 折交叉驗(yàn)證、對(duì)抗驗(yàn)證和權(quán)衡等方法,以及在調(diào)整模型最后一層時(shí)使用交叉驗(yàn)證方法以有效避免過(guò)擬合。

集成方法 許多機(jī)器學(xué)習(xí)競(jìng)賽(包括 Kaggle)中最優(yōu)秀的解決方案所采用的集成方法都建立在一個(gè)這樣的假設(shè)上:將多個(gè)模型組合在一起通常可以產(chǎn)生更強(qiáng)大的模型。 這部分介紹了多種集成方法,如多數(shù)投票法、XGBoost、LightGBM、CatBoost 等方法,以及集成 ResNet50、InceptionV3 和 InceptionResNetV2 的方法。

后處理 這部分介紹了多種后處理方法:

測(cè)試時(shí)增強(qiáng)(Test Time Augmentation,TTA):向模型多次展示經(jīng)過(guò)不同隨機(jī)變換的圖像,取預(yù)測(cè)平均值;

均衡使用測(cè)試預(yù)測(cè)概率,而不是僅使用預(yù)測(cè)類(lèi);

將幾何平均數(shù)應(yīng)用于預(yù)測(cè);

在推理過(guò)程中將圖塊重疊,使每個(gè)邊緣像素至少覆蓋 3 次,因?yàn)?UNET 在邊緣區(qū)域范圍的預(yù)測(cè)往往較差;

非極大抑制和邊界框收縮;

分水嶺后處理:在實(shí)例分割問(wèn)題中分離對(duì)象。

最后需要注意的是,這份列表給出的某些技巧可能有一定的適用范圍,具體能不能用還要視數(shù)據(jù)而定。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135453
  • 圖像分割
    +關(guān)注

    關(guān)注

    4

    文章

    182

    瀏覽量

    18776
  • 計(jì)算機(jī)視覺(jué)

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47630

原文標(biāo)題:圖像分割的「奇技淫巧」

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    圖像采集卡:連接設(shè)備與數(shù)據(jù)的圖像樞紐

    在機(jī)器視覺(jué)與圖像傳輸體系中,圖像采集卡是無(wú)可替代的重要樞紐——它一端承接相機(jī)、內(nèi)窺鏡、攝像機(jī)等前端圖像設(shè)備的信號(hào)輸出,另一端對(duì)接后端數(shù)據(jù)處理、存儲(chǔ)、展示系統(tǒng),通過(guò)信號(hào)轉(zhuǎn)換、同步協(xié)調(diào)、高速傳輸三大能力
    的頭像 發(fā)表于 01-22 13:51 ?233次閱讀
    <b class='flag-5'>圖像</b>采集卡:連接設(shè)備與數(shù)據(jù)的<b class='flag-5'>圖像</b>樞紐

    SAM(通用圖像分割基礎(chǔ)模型)丨基于BM1684X模型部署指南

    前言SAM是Meta提出的一個(gè)分割一切的提示型模型,其在1100萬(wàn)張圖像上訓(xùn)練了超過(guò)10億個(gè)掩碼,實(shí)現(xiàn)了強(qiáng)大的零樣本泛化,突破了分割界限。本例程對(duì)SAM官方開(kāi)源倉(cāng)庫(kù)的模型和算法進(jìn)行移植,使之能
    的頭像 發(fā)表于 01-12 16:17 ?305次閱讀
    SAM(通用<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>基礎(chǔ)模型)丨基于BM1684X模型部署指南

    傳音TEX AI團(tuán)隊(duì)斬獲ICCV 2025大型視頻目標(biāo)分割挑戰(zhàn)賽雙料亞軍

    近日,國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)(ICCV 2025)舉辦了第七屆大型視頻目標(biāo)分割挑戰(zhàn)賽(LSVOS Challenge),傳音TEX AI團(tuán)隊(duì)?wèi){借自主研發(fā)的創(chuàng)新技術(shù)方案,在復(fù)雜視頻目標(biāo)分割和語(yǔ)言指引視頻
    的頭像 發(fā)表于 10-31 09:42 ?558次閱讀
    傳音TEX AI團(tuán)隊(duì)斬獲ICCV 2025大型視頻目標(biāo)<b class='flag-5'>分割</b>挑戰(zhàn)賽雙料亞軍

    使用Otsu閾值算法將灰度圖像二值化

    Otsu 算法是由日本學(xué)者OTSU于1979年提出的一種對(duì)圖像進(jìn)行二值化的高效算法,又稱(chēng)“最大類(lèi)間方差法”。當(dāng)我們對(duì)一個(gè)圖象進(jìn)行二值化操作的時(shí)候,需要根據(jù)一項(xiàng)灰度閾值來(lái)判決每個(gè)像素點(diǎn)應(yīng)該被視作純黑
    發(fā)表于 10-28 06:49

    手機(jī)板 layout 走線跨分割問(wèn)題

    初學(xué)習(xí)layout時(shí),都在說(shuō)信號(hào)線不可跨分割,但是在工作中為了成本不能跨分割似乎也非絕對(duì)。 在后續(xù)工作中,跨分割的基礎(chǔ)都是相鄰層有一面完整的GND參考,跨分割發(fā)生在相鄰的另外一層。 但
    發(fā)表于 09-16 14:56

    MATLAB 助力香港中文大學(xué)解決生物醫(yī)學(xué)圖像處理挑戰(zhàn)

    Processing Toolbox? 加速了生物醫(yī)學(xué)圖像處理工作流程。借助 MathWorks 的軟件,研究人員高效地對(duì)萬(wàn)億體素級(jí)別的圖像進(jìn)行了分割和分析,以往這些任務(wù)需要高端計(jì)算基礎(chǔ)設(shè)施和大量手動(dòng)編程
    的頭像 發(fā)表于 08-28 15:07 ?606次閱讀

    基于黃金分割搜索法的IPMSM最大轉(zhuǎn)矩電流比控制

    摘 要:在矢量控制理論的基礎(chǔ)上,研究了內(nèi)嵌式永磁同步電機(jī)(IPMSM)基于黃金分割搜索法實(shí)現(xiàn)最大轉(zhuǎn)矩電流比控制(MTPA)的方法。該方法利用對(duì)理論最優(yōu)電流矢量角表達(dá)式進(jìn)行多項(xiàng)式擬合所得值作為搜索
    發(fā)表于 07-29 16:11

    北京迅為itop-3588開(kāi)發(fā)板NPU例程測(cè)試deeplabv3 語(yǔ)義分割

    北京迅為itop-3588開(kāi)發(fā)板NPU例程測(cè)試deeplabv3 語(yǔ)義分割
    的頭像 發(fā)表于 07-22 15:51 ?991次閱讀
    北京迅為itop-3588開(kāi)發(fā)板NPU例程測(cè)試deeplabv3 語(yǔ)義<b class='flag-5'>分割</b>

    迅為RK3576開(kāi)發(fā)板攝像頭實(shí)時(shí)推理測(cè)試-ppseg?圖像分割

    迅為RK3576開(kāi)發(fā)板攝像頭實(shí)時(shí)推理測(cè)試-ppseg 圖像分割
    的頭像 發(fā)表于 07-11 14:31 ?871次閱讀
    迅為RK3576開(kāi)發(fā)板攝像頭實(shí)時(shí)推理測(cè)試-ppseg?<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>

    如何將32個(gè)步進(jìn)伺服驅(qū)動(dòng)器塞進(jìn)小型板材分割機(jī)中?

    板材分割機(jī)是工業(yè)制造中常見(jiàn)的裝備。機(jī)器的內(nèi)部空間狹小,如何將多達(dá)32個(gè)步進(jìn)伺服驅(qū)動(dòng)器安裝在其中顯得非常困難。本文將通過(guò)基于EtherCAT總線的插板式步進(jìn)伺服驅(qū)動(dòng)器剖析其破解之法!傳統(tǒng)銑刀式板材分割
    的頭像 發(fā)表于 07-08 11:37 ?540次閱讀
    如何將32個(gè)步進(jìn)伺服驅(qū)動(dòng)器塞進(jìn)小型板材<b class='flag-5'>分割</b>機(jī)中?

    【正點(diǎn)原子STM32MP257開(kāi)發(fā)板試用】基于 DeepLab 模型的圖像分割

    【正點(diǎn)原子STM32MP257開(kāi)發(fā)板試用】圖像分割 本文介紹了正點(diǎn)原子 STM32MP257 開(kāi)發(fā)板基于 DeepLab 模型實(shí)現(xiàn)圖像分割的項(xiàng)目設(shè)計(jì)。 DeepLab 模型 DeepL
    發(fā)表于 06-21 21:11

    凡億Allegro Skill布線功能-檢查跨分割

    能會(huì)導(dǎo)致設(shè)計(jì)中的缺陷和問(wèn)題。為了克服這一挑戰(zhàn),可以利用凡億skill中的“檢查跨分割”命令。這個(gè)工具能夠幫助設(shè)計(jì)者快速而準(zhǔn)確地識(shí)別出高速信號(hào)參考平面的跨分割問(wèn)題,從而避免了人工檢查時(shí)可能出現(xiàn)的疏漏。通過(guò)使用這種自動(dòng)化
    的頭像 發(fā)表于 06-19 11:50 ?2262次閱讀
    凡億Allegro Skill布線功能-檢查跨<b class='flag-5'>分割</b>

    如何修改yolov8分割程序中的kmodel?

    ;#039;''實(shí)驗(yàn)平臺(tái):01Studio CanMV K230說(shuō)明:實(shí)現(xiàn)攝像頭圖像采集顯示-裂縫分割-寬度計(jì)算'''
    發(fā)表于 04-25 08:22

    labview調(diào)用yolo目標(biāo)檢測(cè)、分割、分類(lèi)、obb

    labview調(diào)用yolo目標(biāo)檢測(cè)、分割、分類(lèi)、obb、pose深度學(xué)習(xí),支持CPU和GPU推理,32/64位labview均可使用。 (yolov5~yolov12)
    發(fā)表于 03-31 16:28

    OV9281 CMOS圖像傳感器英文手冊(cè)

    電子發(fā)燒友網(wǎng)站提供《OV9281 CMOS圖像傳感器英文手冊(cè).pdf》資料免費(fèi)下載
    發(fā)表于 03-07 09:23 ?8次下載