国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

分享一種基于深度圖像梯度的線特征提取算法download

jf_pmFSk4VX ? 來源:GiantPandaCV ? 2023-01-08 14:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

0. 筆者個人體會

在低紋理區域,傳統的基于特征點的SfM/SLAM/三維重建算法很容易失敗。因此很多算法會嘗試去提取線特征來提高點特征的魯棒性,典型操作就是LSD

但在一些帶噪聲的低光照環境下,LSD很容易失效。而且線特征檢測的難點在于,由于遮擋,線端點的精確定位很難獲得。

它使用深度學習來處理圖像并丟棄不必要的細節,然后使用手工方法來檢測線段。

因此,DeepLSD不僅對光照和噪聲具有更強魯棒性,同時保留了經典方法的準確性。整篇文章的推導和實驗非常詳實,重要的是算法已經開源!

2. 摘要

線段在我們的人造世界中無處不在,并且越來越多地用于視覺任務中。由于它們提供的空間范圍和結構信息,它們是特征點的補充。

基于圖像梯度的傳統線檢測器非??焖俸蜏蚀_,但是在噪聲圖像和挑戰性條件下缺乏魯棒性。他們有經驗的同行更具可重復性,可以處理具有挑戰性的圖像,但代價是精確度較低,偏向線框線。

我們建議將傳統方法和學習方法結合起來,以獲得兩個世界的最佳效果:一個準確而魯棒的線檢測器,可以在沒有真值線的情況下在野外訓練。

我們的新型線段檢測器DeepLSD使用深度網絡處理圖像,以生成線吸引力場,然后將其轉換為替代圖像梯度幅度和角度,再饋入任何現有的手工線檢測器。

此外,我們提出了一個新的優化工具,以完善基于吸引力場和消失點的線段。

這種改進大大提高了當前深度探測器的精度。我們展示了我們的方法在低級線檢測度量上的性能,以及在使用多挑戰數據集的幾個下游任務上的性能。

3. 算法解讀

作者將深度網絡的魯棒性與手工制作的線特征檢測器的準確性結合起來。具體來說,有如下四步:

(1) 通過引導LSD生成真實線距離和角度場(DF/AF)。

(2) 訓練深度網絡以預測線吸引場DF/AF,然后將其轉換為替代圖像梯度。

(3) 利用手工LSD提取線段。

(4) 基于吸引場DF/AF進行細化。

8c1a4daa-8e4d-11ed-bfe3-dac502259ad0.png

圖1 方法概述

作者所做主要貢獻如下:

(1) 提出了一種自舉當前檢測器的方法來在任意圖像上創建真實線吸引場。

(2) 引入了一個優化過程,可以同時優化線段和消失點。這種優化可以作為一種獨立的細化來提高任何現有的深度線檢測器的精度。

(3) 在多個需要線特征的下游任務中,通過結合深度學習方法的魯棒性和手工方法在單個pipeline中的精度,創造了新的記錄。

3.1 線吸引場

最早通過吸引場表示線段的方法是AFM,為圖像的每個像素回歸一個2D向量場,來表示直線上最近點的相對位置。

該方法允許將離散量(線段)表示為適合深度學習的平滑2通道圖像。然而,這種表示方法并不是獲得精確線段的最佳方法。

如圖2所示,比如HAWP那樣直接預測端點的位置需要很大的感受野,以便能夠從遙遠的端點獲取信息。

8c27bb5c-8e4d-11ed-bfe3-dac502259ad0.png

圖2 吸引場參數化。(a)對二維向量進行參數化可能會對小向量模產生噪聲角。(b) 向端點添加偏移量需要長程信息且對噪聲端點不具有魯棒性。作者提出將距離場(c)和線角度場(d)解耦。

而DeepLSD這項工作的巧妙之處在于,作者提出將網絡限制在一個較小的感受野,并使用傳統的啟發式方法來確定端點。

DeepLSD采用和HAWP類似的吸引場,但沒有額外的兩個指向端點的角度,只保留線距離場(DF)和線角度場(AF)。其中線距離場DF給出當前像素到直線上最近點的距離,線角度場AF返回最近直線的方向:

8c35c1fc-8e4d-11ed-bfe3-dac502259ad0.png

3.2 真值生成

為了學習線吸引場,需要ground truth。AFM和HAWP都是使用線框數據集的真值來監督。但DeepLSD的作者探索了一種新的方法,即通過引導先前的線檢測器來獲取真值。

具體來說,就是通過單應性自適應生成真值吸引場。給定單幅輸入圖像I,將其與N個隨機單應矩陣Hi進行wrap,在所有wrap后的圖像Ii中使用LSD檢測直線段,然后將其wrap回到I來得到線集合Li。

下一步是將所有的線聚合在一起,這一部分是個難點。作者的做法是將線條集合Li轉換為距離場Di和角度場Ai,并通過取所有圖像中每個像素(u, v)的中值來聚合:

8c42bede-8e4d-11ed-bfe3-dac502259ad0.png

通過取中值,可以去除僅在少數圖像中檢測到的噪聲,結果如圖3所示。

8c60f9b2-8e4d-11ed-bfe3-dac502259ad0.png

圖3 偽GT可視化

3.3 學習線吸引場

為了回歸距離場和角度場,DeepLSD使用了UNet架構,尺寸為HxW的輸入圖像經多個卷積層處理,并通過連續3次平均池化操作逐步降采樣至8倍。

然后通過另一系列卷積層和雙線性插值將特征放大回原始分辨率。得到的深度特征被分成兩個分支,一個輸出距離場,一個輸出角度場。最后距離場通過反歸一化得到:

8c6eafbc-8e4d-11ed-bfe3-dac502259ad0.png

其中r是像素中的一個參數,它定義了每條線周圍的區域。由于手工方法主要需要線段附近的梯度信息,因此DeepLSD只對距離線段小于r個像素的像素進行監督。

總損失為距離場和角度場的損失之和:

8c7dc056-8e4d-11ed-bfe3-dac502259ad0.png

這里就沒啥可說的了,LD為歸一化距離場之間的L1損失,LA為L2角度損失:

8c8acb7a-8e4d-11ed-bfe3-dac502259ad0.png

3.4.提取線段

由于LSD是基于圖像梯度的,因此需要將距離場和角度場轉換為替代圖像梯度幅度和角度:

8c9c3c70-8e4d-11ed-bfe3-dac502259ad0.png

AFM和LSD方法的一個重要區別是梯度方向。對于黑暗與明亮區域分離的邊緣,LSD跟蹤從暗到亮的梯度方向,而AFM不跟蹤。

如圖4所示,當幾條平行線以暗-亮-暗或亮-暗-亮的模式相鄰出現時,這就變得很重要。

為了更好的精度和尺度不變性,DeepLSD檢測這些雙邊緣,并構造角度方向:

8ca9eab4-8e4d-11ed-bfe3-dac502259ad0.png

8cb7df34-8e4d-11ed-bfe3-dac502259ad0.png

圖4 區分雙邊緣。(a) 亮-暗-亮邊緣和定向角度場的示例。(b) HAWP將其視為一條直線。(c) 為了準確,DeepLSD將其檢測為兩條線。

為了使線特征更加精確,作者還提出了一個優化步驟,即利用第二步預測的DF和AF來細化。需要注意的是,這種優化方法也可以用來增強任何其他深度探測器的線特征。

優化的核心思路是,在3D中平行的線將共享消失點。因此DeepLSD將其作為軟約束融入到優化中,有效地降低了自由度。

首先利用多模型擬合算法Progressive-X計算一組與預測線段相關的消失點(VPs)。然后對每條線段獨立進行優化,損失函數是三種不同成本的加權無約束最小二乘最小化:

8cc5e7dc-8e4d-11ed-bfe3-dac502259ad0.png8cd3418e-8e4d-11ed-bfe3-dac502259ad0.png

4. 實驗

作者訓練了DeepLSD的兩個版本,一個在室內Wireframe數據集,沒有使用GT線,一個室外MegaDepth數據集。

MegaDepth數據集保留150個場景用于訓練,17個場景用于驗證,每個場景只采集50張圖像。

在實驗細節上,使用Adam優化器和初始學習率為1e3,學習率調整策略為,當損失函數到達一定數值時學習率/10。

硬件條件為,在NVIDIA RTX 2080 GPU上訓練時間12小時。

4.1 直線檢測性能

作者首先在HPatches數據集和RDNIM數據集上評估直線檢測性能,其中HPatches數據集具有不同的光照和視點變化,RDNIM數據集具有挑戰性的晝夜變化相關的圖像對。

評價指標為重復性、定位誤差以及單應估計分數。重復性(Rep)衡量匹配誤差在3個像素以下的直線的比例,定位誤差(LE)返回50個最準確匹配的平均距離。表1和圖5所示是與經典線特征檢測器的對比結果。

表1 在HPatches和RDNIM數據集上的直線檢測評估

8ce0171a-8e4d-11ed-bfe3-dac502259ad0.png8ced81c0-8e4d-11ed-bfe3-dac502259ad0.png

圖5 線段檢測示例

從結果來看,以TPLSD為首的學習方法具有較好的可重復性,但存在較低的定位誤差和不準確的單應矩陣估計。

手工方法和DeepLSD由于不直接對端點進行回歸,而是利用非常低的細節逐步增長線段,因此精度更高。

當變化最具挑戰性時,DeepLSD比LSD表現出最好的改善,即在晝夜變化強烈的RDNIM上。

可以顯著提高定位誤差和單應性估計分數。LSDNet由于通過將圖像縮放到固定的低分辨率而失去了準確性。

總體而言,DeepLSD在手工方法和學習方法之間提供了最佳的權衡,并且在單應性估計的下游任務中始終排名第一。

4.2 重建及定位

這項工作除了評估自身的線特征生成質量外,還進行了三維重建對比。作者利用Line3D++獲取一組已知姿態的圖像和相關的2D線段,并輸出線條的三維重建。

作者在Hypersim數據集的前4個場景上將DeepLSD與幾個基線進行比較。其中召回R為距離網格5 mm以內的所有線段的長度,單位為米,越高意味著許多線條被重建。精度P是距離網格5毫米以內的預測線的百分比,越高表明大部分預測的直線在真實的三維表面上。

結果如表2所示,DeepLSD總體上獲得了最好的召回和精度。TP-LSD雖然在召回上排名第一,但是能夠恢復的直線很少,其平均精度比DeepLSD小71 %。

值得注意的是,DeepLSD比LSD能夠重建更多的直線,且精度更高。

表2 線三維重建對比結果

8cfe6e5e-8e4d-11ed-bfe3-dac502259ad0.png

作者在7Scenes數據集上進行了定位實驗,估計位姿精度,其中Stairs場景對于特征點的定位非常具有挑戰性。

圖6表明,DeepLSD在這個具有挑戰性的數據集上獲得了最好的性能。

與僅使用點相比,可以突出線特征帶來的性能的大幅提升。在室內環境中,線特征提取并定位的性能良好,即使在低紋理場景中也可以匹配。

8d09a260-8e4d-11ed-bfe3-dac502259ad0.png

圖6 7Scenes數據集樓梯的視覺定位結果

4.3 線優化的影響

作者還研究了優化步驟的影響。對于每種方法,作者將原始線條與優化后的線條和VP進行比較。

表3展示了線檢測器在Wireframe測試集的462張圖像上的檢測結果。結果顯示,優化可以顯著改善不精確方法的定位誤差和單應性得分,并顯著提高評價直線精度的所有指標。

特別是對于HAWP和TP-LSD,兩者的定位誤差都下降了32 %,單應性得分提高了27 %和39 %。

注意,優化并沒有給DeepLSD帶來多大提升,這是因為它的原始預測線已經是亞像素精確的,并且優化受到DF和AF分辨率的限制。

表3 Wireframe數據集上的線優化

8d17967c-8e4d-11ed-bfe3-dac502259ad0.png

4.4 消融研究

作者在HPatches數據集上用低級別檢測器指標驗證了設計選擇,將DeepLSD與單邊相同模型進行比較。表4展示了各組成部分的重要性。

值得注意的是,在DeepLSD上重新訓練HAWP會導致較差的結果,因為與線框線相比,線條的數量更多,而且一般的直線往往有噪聲的端點,因此預測到兩個端點的角度也是有噪聲的。

表4 HPatches數據集上的消融實驗

8d2557b2-8e4d-11ed-bfe3-dac502259ad0.png

5. 結論

作者提出了一種混合線段檢測器,結合了深度學習的魯棒性和手工檢測器的準確性,并使用學習的替代圖像梯度作為中間表示。還提出了一種可以應用于現有深度檢測器的優化方法,彌補了深度檢測器和手工檢測器之間的線局部化的差距。





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 檢測器
    +關注

    關注

    1

    文章

    932

    瀏覽量

    49940
  • SLAM
    +關注

    關注

    24

    文章

    457

    瀏覽量

    33325
  • AFM
    AFM
    +關注

    關注

    0

    文章

    62

    瀏覽量

    20815

原文標題:DeepLSD:基于深度圖像梯度的線段檢測和細化

文章出處:【微信號:GiantPandaCV,微信公眾號:GiantPandaCV】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    算法工程師需要具備哪些技能?

    (PCA)、異常檢測等。強化學習:Q-learning、Policy Gradient等(適用于游戲AI、機器人控制)。 深度學習神經網絡基礎:前向傳播、反向傳播、激活函數等。CNN:圖像特征提取(如
    發表于 02-27 10:53

    瑞芯微(EASY EAI)RV1126B 人臉識別使用

    1.人臉識別簡介人臉識別,是基于人的臉部特征信息進行身份識別的一種生物識別技術。用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部識別
    的頭像 發表于 01-10 10:00 ?2017次閱讀
    瑞芯微(EASY EAI)RV1126B 人臉識別使用

    電能質量在線監測裝置如何捕捉充電樁充電過程中的電流畸變特征?

    ,實現從 “波形采集→畸變分解→特征提取→合規評估” 的全鏈路監測。 、充電樁電流畸變的核心特征(監測基礎) 充電樁作為典型非線性負載,其電流畸變具有以下顯著特點: 波形特征:僅在電
    的頭像 發表于 12-10 10:26 ?388次閱讀
    電能質量在線監測裝置如何捕捉充電樁充電過程中的電流畸變<b class='flag-5'>特征</b>?

    京東拍立淘API開發指南:從零開始構建圖像搜索應用

    京東圖片識別搜索API(拍立淘)是基于深度學習的視覺搜索服務,通過卷積神經網絡提取圖像特征向量,結合近似最近鄰搜索算法實現商品精準匹配?。該
    的頭像 發表于 11-09 17:40 ?2158次閱讀

    使用Otsu閾值算法將灰度圖像二值化

    Otsu 算法是由日本學者OTSU于1979年提出的一種圖像進行二值化的高效算法,又稱“最大類間方差法”。當我們對個圖象進行二值化操作的
    發表于 10-28 06:49

    淘寶圖片搜索接口開發實戰:從 CNN 特征提取到商品匹配(附避坑手冊 + 可復用代碼)

    本文詳解淘寶圖片搜索接口開發全流程,涵蓋CNN特征提取、商品匹配、參數配置及400/429等高頻報錯解決方案,附合規避坑指南與可復用代碼,助你高效實現圖像搜商品功能。
    的頭像 發表于 10-21 10:03 ?539次閱讀

    基于FPGA的CLAHE圖像增強算法設計

    CLAHE圖像增強算法又稱為對比度有限的自適應直方圖均衡算法,其算法原理是通過有限的調整圖像局部對比度來增強有效信號和抑制噪聲信號。
    的頭像 發表于 10-15 10:14 ?650次閱讀
    基于FPGA的CLAHE<b class='flag-5'>圖像</b>增強<b class='flag-5'>算法</b>設計

    大電流起弧過程中電弧聲壓/超聲波信號的特征提取與故障診斷

    接觸不良、絕緣破損、元件老化等故障時,電弧的燃燒狀態會發生改變,相應的聲壓超聲波信號也會出現異常變化。因此,通過提取這些信號中的關鍵特征,并結合特征變化規律進行分析,就能實現對大電流起弧過程中故障的精準診
    的頭像 發表于 09-29 09:27 ?505次閱讀
    大電流起弧過程中電弧聲壓/超聲波信號的<b class='flag-5'>特征提取</b>與故障診斷

    機器視覺檢測PIN針

    : 結合形態學處理、特征提取(如長寬比、面積)及深度學習(針對復雜缺陷),自動檢出彎曲、斷裂、變形、污染等。輸出與控制:實時顯示檢測結果(OK/NG)及具體參數數值。生成檢測報告,支持數據追溯。NG品自動剔除信號輸出,無縫對接產
    發表于 09-26 15:09

    一種新型激光雷達慣性視覺里程計系統介紹

    針對具有挑戰性的光照條件和惡劣環境,本文提出了LIR-LIVO,這是一種輕量級且穩健的激光雷達-慣性-視覺里程計系統。通過采用諸如利用深度與激光雷達點云關聯實現特征的均勻深度分布等先進
    的頭像 發表于 04-28 11:18 ?1089次閱讀
    <b class='flag-5'>一種</b>新型激光雷達慣性視覺里程計系統介紹

    【「# ROS 2智能機器人開發實踐」閱讀體驗】+ROS2應用案例

    方法,包括SLAM Toolbox的使用。 通過學習這部分,我了解到SLAM的基本原理,包括特征提取特征匹配、地圖構建和定位等關鍵步驟。書中還介紹了如何在ROS 2中使用SLAM Toolbox進行
    發表于 04-27 11:42

    在友晶LabCloud平臺上使用PipeCNN實現ImageNet圖像分類

    利用深度卷積神經網絡(CNN)進行圖像分類是通過使用多個卷積層來從輸入數據中提取特征,最后通過分類層做決策來識別出目標物體。
    的頭像 發表于 04-23 09:42 ?1080次閱讀
    在友晶LabCloud平臺上使用PipeCNN實現ImageNet<b class='flag-5'>圖像</b>分類

    概倫電子標準單元庫特征化解決方案NanoCell介紹

    標準單元庫包括電路設計、版圖設計和特征提取,它對芯片設計至關重要。其中標準單元庫的特征提取需要大量仿真、模型提取和驗證,在標準單元庫開發中占據了三分之
    的頭像 發表于 04-16 09:49 ?1016次閱讀
    概倫電子標準單元庫<b class='flag-5'>特征</b>化解決方案NanoCell介紹

    一種基于點、和消失點特征的單目SLAM系統設計

    本文提出了一種穩健的單目視覺SLAM系統,該系統同時利用點、和消失點特征來進行精確的相機位姿估計和地圖構建,有效解決了傳統基于點特征的SLAM的局限性。
    的頭像 發表于 03-21 17:07 ?1051次閱讀
    <b class='flag-5'>一種</b>基于點、<b class='flag-5'>線</b>和消失點<b class='flag-5'>特征</b>的單目SLAM系統設計

    給個思路也可以(不知道這個無線通信模塊怎么實現)

    有償定做個智能考勤機 要求:(1)指紋模塊:采集指紋圖像和傳輸指紋信息,對指紋圖像進行預處理,消除噪聲干擾,還原圖像的真實特征信息。完成
    發表于 03-21 16:50