国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

眾多常見的有效圖像預處理方法

新機器視覺 ? 來源:機器之心 ? 作者:機器之心 ? 2021-05-03 18:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一個經歷了 39 場 Kaggle 比賽的團隊在 reddit 上發帖表示,他們整理了一份結構化的圖像分割技巧列表,涵蓋數據增強、建模、損失函數、訓練技巧等多個方面,不失為一份可以參考的圖像分割技巧資料。

圖像分割是圖像處理和計算機視覺的熱點之一,是根據圖像內容對指定區域進行標記的計算機視覺任務。它基于某些標準將輸入圖像劃分為多個相同的類別,簡言之就是「這張圖片里有什么,其在圖片中的位置是什么?」以便提取人們感興趣的區域。圖像分割是圖像分析和圖像特征提取及識別的基礎。

圖像分割也是 Kaggle 中的一類常見賽題,比如衛星圖像分割與識別、氣胸疾病圖像分割等。除了密切的團隊配合、給力的 GPU 配置等條件,技巧在這類比賽中也發揮了很大的作用。但這些技巧去哪里找呢?Medium、大牛博客、參賽經驗帖中都散落著各種技巧分享,但這些資源往往比較零散,于是就有人想到,為什么不把它們集中到一起呢? Derrick Mwiti 就帶頭做了這么一件事,他和他所在的團隊將過去 39 場 Kaggle 比賽中討論過的圖像分割技巧、資料都匯總到了一起,希望可以幫到在圖像分割任務中遇到困難的同學。 這份列表分為十大板塊,包括外部數據、預處理、數據增強、建模、硬件配置、損失函數、訓練技巧、評估和交叉驗證、集成方法以及后處理。

每個版塊的具體內容以條目的形式呈現,每個條目又都嵌入了一些鏈接,點開可以看到一些優秀的 Kaggle 解決方案分享、Medium 博客教程、高贊的 GitHub 項目等,讀者可以根據自己的具體問題和需要進行查找。 本文選取了其中一部分內容進行介紹,具體細節及鏈接請參見原文。 接下來,我們來看每個步驟都有哪些技巧吧。 預處理 這一部分包含眾多常見的有效圖像預處理方法,例如:

使用高斯差分方法進行斑點檢測;

使用基于圖像塊的輸入進行訓練,以減少訓練時間;

加載數據時,用 cudf 替換 Pandas;

確保所有圖像保持相同的方向;

使用 OpenCV 對所有常規圖像進行預處理;

采用自主學習并手動添加注釋;

將所有圖像調整成相同的分辨率,以便將相同的模型用于不同厚度的掃描等。

數據增強 數據增強能夠使網絡具有更復雜的表征能力,從而減小網絡性能在驗證集和訓練集以及最終測試集上的差距,讓網絡更好地學習遷移數據集上的數據分布。這部分介紹了一些常用的數據增強方法:

用 albumentations 包進行數據增強;

使用 90 度隨機旋轉;

使用水平、垂直翻轉或這兩個方向都做翻轉;

嘗試進行復雜的幾何變換,包括彈性變換、透視變換、分段仿射變換、枕形失真;

應用隨機 HSV;

使用損失較小的增強數據進行泛化,以防止有用圖像信息丟失;

應用通道 shuffle;

根據類別頻率進行數據擴充;

應用高斯噪聲等。

建模網絡架構 這一部分介紹了一些可用在圖像分割上的常用網絡框架,例如:

使用基于 U-net 的架構;

用 inception-ResNet v2 架構得到具備不同感受野的訓練特征;

經過對抗訓練的 Siamese 網絡;

以密集(FC)層作為最后一層的 ResNet50、Xception、Inception ResNet v2 x 5;

使用全局最大池化層,無論輸入尺寸如何,該層都將返回固定長度的輸出;

使用堆疊的膨脹卷積;

VoxelNet;

用 concat 和 conv1x1 替換 LinkNet 跳躍連接中的加號;

廣義平均池化;

用 3D 卷積網絡在圖像上滑動;

使用在 Imagenet 數據集上預訓練的 ResNet152 作為特征提取器等。

以及下列經典網絡框架:

23f94f26-9cde-11eb-8b86-12bb97331649.png

損失函數 損失函數常用來估計模型預測結果與真值之間的差距。選擇合適的損失函數,對模型效果很重要。 這部分介紹了一系列損失函數和使用場景,例如:

dice 系數:能夠很好地處理不平衡數據;

加權邊界損失:減少預測分割與真值之間的距離;

MultiLabelSoftMarginLoss:基于最大熵優化多標簽一對多損失的標準;

具備 logit 損失的平衡交叉熵(Balanced cross entropy,BCE):以特定系數權衡正例和負例;

……

此外,作者還介紹了 Arc margin 損失、BCE 和 dice 系數的組合等等,更多詳情參見原文。

訓練技巧 這部分介紹了常用的模型訓練技巧,如:

嘗試不同的學習率;

嘗試不同批大小;

使用帶有動量項的 SDG,并且手動設置學習率衰減;

數據增強過多會降低準確率;

使用裁剪后的圖像訓練,并在完整的圖像上做預測;

在學習速率調整上使用 Keras 中的 ReduceLROnPlateau() 方法;

凍結除了最后一層以外所有的網絡層,并使用 Stage1 中的 1000 張圖片進行模型微調;

開發一個能使標簽更加均勻的采樣器;

使用類別感知采樣(class aware sampling)等。

評估和交叉驗證 這部分介紹了 k 折交叉驗證、對抗驗證和權衡等方法,以及在調整模型最后一層時使用交叉驗證方法以有效避免過擬合。

集成方法 許多機器學習競賽(包括 Kaggle)中最優秀的解決方案所采用的集成方法都建立在一個這樣的假設上:將多個模型組合在一起通常可以產生更強大的模型。 這部分介紹了多種集成方法,如多數投票法、XGBoost、LightGBM、CatBoost 等方法,以及集成 ResNet50、InceptionV3 和 InceptionResNetV2 的方法。

后處理 這部分介紹了多種后處理方法:

測試時增強(Test Time Augmentation,TTA):向模型多次展示經過不同隨機變換的圖像,取預測平均值;

均衡使用測試預測概率,而不是僅使用預測類;

將幾何平均數應用于預測;

在推理過程中將圖塊重疊,使每個邊緣像素至少覆蓋 3 次,因為 UNET 在邊緣區域范圍的預測往往較差;

非極大抑制和邊界框收縮;

分水嶺后處理:在實例分割問題中分離對象。

最后需要注意的是,這份列表給出的某些技巧可能有一定的適用范圍,具體能不能用還要視數據而定。

原文標題:圖像分割的實用技巧

文章出處:【微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像處理
    +關注

    關注

    29

    文章

    1342

    瀏覽量

    59543
  • 機器視覺
    +關注

    關注

    165

    文章

    4798

    瀏覽量

    126075

原文標題:圖像分割的實用技巧

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    傾斜儀常見故障診斷與排除方法

    傾斜儀在工程監測應用中,可能因環境因素或安裝問題出現各類故障。了解常見故障的識別與處理方法,對保障監測數據連續性具有重要意義。常見故障類型與診斷讀數異常是傾斜儀最
    的頭像 發表于 03-02 14:39 ?117次閱讀
    傾斜儀<b class='flag-5'>常見</b>故障診斷與排除<b class='flag-5'>方法</b>

    LED顯示屏常見故障分類及處理方法

    常見故障分類LED顯示屏常見故障分為三類:LED模組常見故障、室內全彩顯示屏故障及戶外全彩顯示屏故障。針對每一類故障,我們將詳細分析可能的原因,并提供具體的檢測與維修步驟。LED模組常見
    的頭像 發表于 12-18 15:48 ?1150次閱讀
    LED顯示屏<b class='flag-5'>常見</b>故障分類及<b class='flag-5'>處理</b><b class='flag-5'>方法</b>

    矢量變頻器常見故障及處理方法

    故障類型、診斷方法處理措施,并結合實際案例提供解決方案,幫助技術人員快速定位和解決問題。 一、過電流故障 過電流是矢量變頻器最常見的故障之一,主要表現為運行中突然停機并顯示“OC”報警(Over Current)。根據觸發時機
    的頭像 發表于 11-29 07:40 ?676次閱讀
    矢量變頻器<b class='flag-5'>常見</b>故障及<b class='flag-5'>處理</b><b class='flag-5'>方法</b>

    數據預處理軟核加速模塊設計

    數據拼接操作,其預處理模塊結構框圖如下圖 模塊最后得到的信號為ddr_q、ddr_clk和ddr_wrreq。ddr_q是并行128bits圖像數據,ddr_clk是RAM的出口時鐘,同時引出作為下一模塊的數據時鐘,ddr_wrreq置高時代表
    發表于 10-29 08:09

    慧視光電——全棧圖像處理板供應商

    隨著AI日益滲透到各行各業,作為支撐平臺的圖像處理板日益成為人們關注的焦點,由于原來的系統集成商或一級配套單位不具備或者不完全具備圖像處理案板的整體研發整理,因此全棧
    的頭像 發表于 10-23 18:02 ?561次閱讀
    慧視光電——全棧<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>板供應商

    友思特方案 | FPGA 加持,友思特圖像采集卡高速預處理助力視覺系統運行提速增效

    圖像預處理圖像處理關鍵中間環節,通過優化傳感器到主機的數據傳輸處理為后續減負。其算法依托硬件執行,搭載?FPGA?的友思特
    的頭像 發表于 08-20 09:18 ?1048次閱讀
    友思特方案 | FPGA 加持,友思特<b class='flag-5'>圖像</b>采集卡高速<b class='flag-5'>預處理</b>助力視覺系統運行提速增效

    FPGA 加持,友思特圖像采集卡高速預處理助力視覺系統運行提速增效

    圖像預處理圖像處理關鍵環節,可優化數據傳輸、減輕主機負擔,其算法可在FPGA等硬件上執行。友思特FPGA圖像采集卡憑借FPGA特性,能縮短
    的頭像 發表于 08-13 17:41 ?1120次閱讀
    FPGA 加持,友思特<b class='flag-5'>圖像</b>采集卡高速<b class='flag-5'>預處理</b>助力視覺系統運行提速增效

    鋰電池制造 | 電芯預處理工藝的步驟詳解

    電芯預處理是鋰電池包制造的首要工序,無論是新能源汽車的續航穩定性,還是儲能系統的循環壽命,其根基都可追溯至預處理工序對電芯一致性的把控,其核心在于通過系統檢測與篩選消除量產電芯的性能差異,為后續組裝
    的頭像 發表于 08-11 14:53 ?1543次閱讀
    鋰電池制造 | 電芯<b class='flag-5'>預處理</b>工藝的步驟詳解

    諧波怎么處理最簡單的方法

    諧波問題是電力系統中常見的電能質量問題,它不僅影響設備正常運行,還可能造成能源浪費和設備損壞。針對諧波處理的最簡單方法,我們可以從以下幾個方面入手: 一、理解諧波產生的原因 諧波主要由非線性負載產生
    的頭像 發表于 07-13 16:35 ?3450次閱讀
    諧波怎么<b class='flag-5'>處理</b>最簡單的<b class='flag-5'>方法</b>

    HarmonyOS應用圖像stride處理方案

    圖像存儲在內存中時,內存緩沖區可能在每行像素之后包含額外的填充字節。填充字節會影響圖像在內存中的存儲方式,但不會影響圖像的顯示方式。stride是內存中一行像素到內存中下一行像素的字節數;如果存在填充字節,則步幅比
    的頭像 發表于 06-10 14:17 ?1233次閱讀
    HarmonyOS應用<b class='flag-5'>圖像</b>stride<b class='flag-5'>處理</b>方案

    常見的PFC拓撲架構及控制方法

    本期,芯朋微技術團隊將為各位fans分享常見的PFC拓撲架構及控制方法,為設計選型提供參考。
    的頭像 發表于 04-27 18:03 ?7567次閱讀
    <b class='flag-5'>常見</b>的PFC拓撲架構及控制<b class='flag-5'>方法</b>

    軟起動器維修常見故障及處理方法

    軟啟動器在電動機的啟動、運行和停止過程中起著關鍵作用,但在使用過程中,可能會出現各種故障。以下是一些常見的軟啟動器故障及其處理方法: 一、上電后無顯示 故障原因:外部電源未接入。 處理
    的頭像 發表于 04-08 07:37 ?4361次閱讀
    軟起動器維修<b class='flag-5'>常見</b>故障及<b class='flag-5'>處理</b><b class='flag-5'>方法</b>

    FPGA Verilog HDL語法之編譯預處理

    Verilog HDL語言和C語言一樣也提供了編譯預處理的功能。“編譯預處理”是Verilog HDL編譯系統的一個組成部分。Verilog HDL語言允許在程序中使用幾種特殊的命令(它們不是一般
    的頭像 發表于 03-27 13:30 ?1438次閱讀
    FPGA Verilog HDL語法之編譯<b class='flag-5'>預處理</b>

    基于嵌入式人工智能的高速圖像處理的微處理器RZ/A2M數據手冊

    RZ/A2M MPU設計用于需要高速e-AI圖像處理的智能電器,網絡攝像機,服務機器人,掃描儀產品和工業機械。它采用獨特的圖像識別和機器視覺混合方法,結合了專有的DRP技術,對
    的頭像 發表于 03-11 15:54 ?1025次閱讀
    基于嵌入式人工智能的高速<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>的微<b class='flag-5'>處理</b>器RZ/A2M數據手冊