国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種基于RGB-D圖像序列的協同隱式神經同步定位與建圖(SLAM)系統

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-11-29 10:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2. 摘要

提出了一種基于RGB-D圖像序列的協同隱式神經同步定位與建圖(SLAM)系統,該系統由完整的前端和后端模塊組成,包括里程計、回環檢測、子圖融合和全局優化。為了在一個統一的框架中啟用所有這些模塊,我們提出了一種新的基于神經點的3D場景表示,其中每個點都保持用于場景編碼的可學習神經特征,并且與某個關鍵幀相關聯。此外,還提出了一種從分布式到集中式的協作隱式SLAM學習策略,以提高一致性和協調性。與傳統的光束法平差一樣,本文還提出了一種新的全局優化框架來提高系統精度。在不同數據集上的實驗證明了該方法在相機跟蹤和建圖方面的優越性。

3. 算法解析

重新理一下思路,NeRF SLAM為啥火?

因為NeRF和SLAM可以相互輔助,SLAM為NeRF訓練提供位姿,NeRF可以重建高清晰度的地圖、做空洞補全、或者用光度損失反過來優化位姿。

有什么問題?

個人感覺現在NeRF SLAM有兩個問題,一個是計算量大難以落地,一個是因為做不了回環和全局優化導致定位精度低。

CP-SLAM的核心思想是什么?

傳統的NeRF地圖不好做回環和優化,但是改成基于點的NeRF地圖,就可以像傳統SLAM那樣去優化了!

具體是如何實現的?

CP-SLAM本身是一個多機協同SLAM,輸入是RGB-D數據流,每個SLAM系統分別執行跟蹤和建圖,最后執行子地圖融合。每個SLAM系統都維護一個神經點輻射場,借助3個MLP(特征融合、顏色場、占用場)來渲染深度圖和顏色圖。通過計算光度和幾何損失來優化輻射場和相機位姿。同時每個單獨的SLAM不斷地用NetVLAD提取關鍵幀描述子,并發送到描述子池(有點像ORB-SLAM的關鍵幀數據庫),中央服務器檢測到回環以后融合子地圖,并執行全局BA。最后再做一個以關鍵幀為中心的地圖優化。

cc4d2ee8-8d79-11ee-939d-92fbcf53809c.png

下面來逐個聊聊每個子模塊的具體原理。

這個神經點是啥?

神經點輻射場來源于CVPR 2022 oral的文章Point-NeRF,用神經點表示三維場景。其實就是讓空間中的點同時存儲位置信息(xyz)和局部場景信息(單層CNN提取的神經特征向量,CP-SLAM里是32維),原始Point-NeRF的神經點里還存儲了[0, 1]范圍的置信度,表示這個點有多大概率離真實物體很近。

當然,使用神經點輻射場也有優點有缺點:

優點:執行回環檢測和BA優化時,3D點比原始NeRF場景更好調整,所以就很容易引入回環和局部地圖優化。

缺點:由于神經點分布在觀察對象的表面周圍,因此未見區域的空洞填補能力弱于特征網格方法。

位姿跟蹤和NeRF建圖如何進行?

輻射場采樣上也用到了一個trick,就是盡量讓采樣點貼近物體表面。對于深度有效的點,分別從[0.95D, 1.05D]和[0.95Dmin, 1.05Dmax]區間內均勻采樣,D表示點的深度值,Dmin和Dmax表示整個深度圖的最小最大深度。

對每個采樣點xi,首先檢索它半徑r范圍內的K個鄰域點,用一個MLP(框圖中的C)分別處理這K個點,使每個點的特征向量都融合了跟采樣點的距離信息(對應f~k,x~):

cc66f8be-8d79-11ee-939d-92fbcf53809c.png

再用一個MLP(框圖中的U)來學習采樣點xi的RGB信息,這里就需要用到上一步K個點的特征向量了:

cc7b753c-8d79-11ee-939d-92fbcf53809c.png

最后還需要用一個MLP(框圖中的G)來學習采樣點xi的占用概率,這里還是用到上上步計算的K個特征向量,當然如果沒有鄰域點那占用肯定就是0了:

cc9d8cc6-8d79-11ee-939d-92fbcf53809c.png

這兩步預測的占用和顏色信息實際上表示了射線中止的概率α,再加上深度值z就可以渲染得到當前視角的深度圖和RGB圖:

ccba8682-8d79-11ee-939d-92fbcf53809c.png

然后就可以使用深度圖和RGB圖計算幾何損失和光度損失來優化位姿、點特征向量、還有3個MLP:

ccd41fa2-8d79-11ee-939d-92fbcf53809c.png

這里還有幾個需要注意的點:

1、整個序列的第一幀需要采樣很多的點來初始化,優化步驟達到3000~5000次;

2、位姿表示成四元數和平移格式,當前幀位姿的初始值設置為上一幀的位姿,優化時要固定神經特征向量和3個MLP權重;

3、優化位姿沒有用到光度損失,作者認為RGB圖是一個高度非凸問題。

基于學習的回環檢測如何實現?

這部分主要是用于融合多個SLAM系統分別建立的子地圖,并減少位姿的累計漂移。首先對每個關鍵幀用預訓練的NetVLAD提取描述子,并把描述子扔到池子里(類似ORB-SLAM的關鍵幀數據庫),然后用余弦相似性來檢測回環。

局部優化很吃初值,如果兩幀運動太快的話,就很容易陷入局部最優,所以CP-SLAM采用了一個由粗到精的回環檢測策略。如果相似性超過λfine的話直接執行回環優化和子地圖融合,如果低于λfine但高于λcoarse的話就只做一個位姿圖優化。當然子地圖融合之后肯定有大量的冗余點,還需要做一步非極大值抑制(網格過濾)。

cceb995c-8d79-11ee-939d-92fbcf53809c.png

SLAM協同如何實現?

CP-SLAM本身就是一個協同SLAM,協同部分是設計了一個兩階段(從分布式到集中式)的MLP訓練策略,來提高協作一致性。分布式階段就是每個SLAM單獨做跟蹤和優化,執行回環和子地圖融合以后就進入集中式階段,注意集中式階段需要一個中心服務器來做子圖和優化的全局管理。

這個階段用的是聯合學習,也就是以共享的方式訓練單個網絡。在子地圖融合的同時,對每組MLP進行平均處理,并對所有關鍵幀上的平均MLP進行微調,隨后將共享MLP轉移到每個SLAM做訓練,并且平均每個SLAM權重作為共享MLP的最終優化結果。

cd04875a-8d79-11ee-939d-92fbcf53809c.png

最后簡單說一下位姿圖優化

這個模塊分為兩部分,一部分是維護子地圖的共視圖,一部分是是基于幀的地圖優化。在執行子地圖融合后做全局優化,位姿圖中每幀的位姿是頂點,序列相對位姿和回環相對位姿是邊,優化還是用的L-M算法。

為了方便優化3D點云位置,作者還做了一個trick:每個3D點都與一個關鍵幀相關聯。

cd2abdf8-8d79-11ee-939d-92fbcf53809c.png

4. 實驗結果

實驗這一塊分別對比了單機SLAM和協作SLAM模式,單機SLAM對比在Replica數據集進行,對比傳統SLAM(ORB-SLAM3)和NeRF SLAM(NICE-SLAM和Vox-Fusion),協同SLAM對比的傳統SLAM方案(CCM-SLAM、Swarm-SLAM、ORB-SLAM3)。CP-SLAM的運行環境是一塊3090,如果需要做協同的話,就再需要一塊3090做為中心服務器。

雙機協作精度的定量對比,注意ORB-SLAM3本身不是協作SLAM,所以作者的實驗方法是融合數據集,然后用ORB-SLAM3的多地圖系統來執行地圖融合。

cd408340-8d79-11ee-939d-92fbcf53809c.png

4個場景上CP-SLAM和CCM-SLAM的協作實驗軌跡對比,可以發現CP-SLAM的地圖融合效果還是比較好的。

cd5829f0-8d79-11ee-939d-92fbcf53809c.png

單機SLAM的精度對比,這個就說明CP-SLAM的精度超越ORB-SLAM3了。當然如果不加入回環的話,CP-SLAM精度還是不夠,這一點上說明限制NeRF SLAM精度提升的關鍵就在局部地圖優化和回環優化。

cd6e7868-8d79-11ee-939d-92fbcf53809c.png

單機SLAM軌跡的定性對比,對比的NICE-SLAM和Vox-Fusion這兩個NeRF SLAM方案,沒有對比ORB-SLAM3。

cd955438-8d79-11ee-939d-92fbcf53809c.png

TUM數據集上精度和魯棒性的定量對比,但對比的還是只有Co-SLAM和ESLAM這兩個NeRF SLAM方案,沒對比ORB-SLAM3。這里也推薦工坊推出的新課程《徹底剖析激光-視覺-IMU-GPS融合SLAM算法:理論推導、代碼講解和實戰》。

cdc0fe4e-8d79-11ee-939d-92fbcf53809c.png

NeRF建圖的定量對比,證明三維重建的精度超越了之前的NeRF SLAM方案。

cde68786-8d79-11ee-939d-92fbcf53809c.png

NeRF建圖的定性對比。

ce0fe216-8d79-11ee-939d-92fbcf53809c.png

神經點密度的消融實驗,證明神經點不是越多越好,也不是越少越好。

ce3fa58c-8d79-11ee-939d-92fbcf53809c.png

Office-0-loop場景上運行時間和內存消耗的定量對比,包括單幀跟蹤時間、建圖時間、MLP大小、整個神經場的內存大小。NICE-SLAM神經場的尺寸超級大,這是因為它為了解決遺忘問題設計的多層特征網格。

ce650bba-8d79-11ee-939d-92fbcf53809c.png

地圖優化和采樣點融合的消融實驗,還是驗證它們的策略是對的。

ce80a596-8d79-11ee-939d-92fbcf53809c.png

5. 總結

本文介紹了浙大最新的工作CP-SLAM,號稱是第一個基于NeRF的協作SLAM,跟傳統SLAM一樣具備前后端,定位精度和建圖質量都有了很大提升。可惜沒有開源。






審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • RGB
    RGB
    +關注

    關注

    4

    文章

    831

    瀏覽量

    61934
  • CCM
    CCM
    +關注

    關注

    0

    文章

    173

    瀏覽量

    25606
  • SLAM
    +關注

    關注

    24

    文章

    457

    瀏覽量

    33322
  • MLP
    MLP
    +關注

    關注

    0

    文章

    57

    瀏覽量

    4989

原文標題:NeurlPS'23 | 第一個協作神經隱式SLAM!(浙大NICE-SLAM團隊最新力作)

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    激光雷達助力泳池水下機器人+定位全覆蓋

    激光雷達助力泳池水下機器人+定位全覆蓋
    的頭像 發表于 02-25 14:24 ?192次閱讀
    激光雷達助力泳池水下機器人<b class='flag-5'>建</b><b class='flag-5'>圖</b>+<b class='flag-5'>定位</b>全覆蓋

    什么是激光雷達 3D SLAM技術?

    (SimultaneousLocalizationandMapping)即時定位,通俗來講,就是讓智能設備在未知環境中同步完成自身位置測算與周邊環境地圖構建。這兩個過程互為支撐,
    的頭像 發表于 12-02 19:23 ?583次閱讀
    什么是激光雷達 3<b class='flag-5'>D</b> <b class='flag-5'>SLAM</b>技術?

    在Ubuntu20.04系統中訓練神經網絡模型的些經驗

    本帖欲分享在Ubuntu20.04系統中訓練神經網絡模型的些經驗。我們采用jupyter notebook作為開發IDE,以TensorFlow2為訓練框架,目標是訓練個手寫數字識
    發表于 10-22 07:03

    文讀懂 RGB接口的 DE模式 和 行場(HV)模式 區別

    DE模式 (Data Enable Mode) 這是一種更現代的同步方式,也被稱為“數據有效”模式。 同步信號:只使用個信號: DE (數據使能):這是
    發表于 09-18 14:18

    嵌入接口通識知識之RGB接口

    、綠、藍三顏色的信號,來實現彩色圖像的顯示。每一種顏色信號都獨立地控制了顯示設備上對應顏色的亮度和色彩深度。它可以通過不同的傳輸方式實現,包括模擬RGB和數字
    發表于 08-29 15:54

    一種適用于動態環境的自適應先驗場景-對象SLAM框架

    由于傳統視覺SLAM在動態場景中容易會出現嚴重的定位漂移,本文提出了一種新穎的基于場景-對象的可靠性評估框架,該框架通過當前幀質量指標以及相對于可靠參考幀的場景變化,全面評估SLAM
    的頭像 發表于 08-19 14:17 ?873次閱讀
    <b class='flag-5'>一種</b>適用于動態環境的自適應先驗場景-對象<b class='flag-5'>SLAM</b>框架

    一種適用于動態環境的實時RGB-D SLAM系統

    了UP-SLAM,這是一種適用于動態環境的實時RGB-D SLAM系統。實驗結果表明,UP-SLAM
    的頭像 發表于 07-04 15:14 ?1288次閱讀
    <b class='flag-5'>一種</b>適用于動態環境的實時<b class='flag-5'>RGB-D</b> <b class='flag-5'>SLAM</b><b class='flag-5'>系統</b>

    一種適用于動態環境的3DGS-SLAM系統

    當前基于神經輻射場(NeRF)或3D高斯潑濺(3DGS)的SLAM方法在重建靜態3D場景方面表現出色,但在動態環境中的跟蹤和重建方面卻面臨著挑戰。
    的頭像 發表于 06-13 10:10 ?1388次閱讀
    <b class='flag-5'>一種</b>適用于動態環境的3DGS-<b class='flag-5'>SLAM</b><b class='flag-5'>系統</b>

    同步發電機技術要求資料

    同步發電機技術要求
    發表于 06-10 15:16 ?1次下載

    寬調速范圍低轉矩脈動的一種新型內置永磁同步電機的設計與分析

    摘要:寬調速范圍與低轉矩脈動直是設計電動汽車用內置永礎同步電機時所追求的重要目標。設計了一種轉子結構為胃的新型內置永礎
    發表于 06-06 14:13

    三維高斯潑濺大規模視覺SLAM系統解析

    仍未得到探索。本文提出一種基于立體相機的三維高斯潑濺大規模視覺SLAM系統LSG-SLAM。通過在EuRoC數據集上的廣泛評估,LSG-SLAM
    的頭像 發表于 05-27 14:13 ?1566次閱讀
    三維高斯潑濺大規模視覺<b class='flag-5'>SLAM</b><b class='flag-5'>系統</b>解析

    【「# ROS 2智能機器人開發實踐」閱讀體驗】視覺實現的基礎算法的應用

    結合IMU(慣性測量單元)進行多傳感器融合。 三、總結與展望 技術融合趨勢 機器人視覺與SLAM的結合(如視覺慣性里程計VIO)是當前研究熱點,未來可能進步結合語義SLAM,讓機器人不僅能
    發表于 05-03 19:41

    基于衛星圖像的智能定位系統軟件

    應用中取得了顯著成效。例如,北京華盛恒輝和北京五木恒潤基于衛星圖像的智能定位系統。這些成功案例為基于衛星圖像的智能定位
    的頭像 發表于 04-01 09:55 ?1022次閱讀

    一種基于點、線和消失點特征的單目SLAM系統設計

    本文提出了一種穩健的單目視覺SLAM系統,該系統同時利用點、線和消失點特征來進行精確的相機位姿估計和地圖構建,有效解決了傳統基于點特征的SLAM
    的頭像 發表于 03-21 17:07 ?1049次閱讀
    <b class='flag-5'>一種</b>基于點、線和消失點特征的單目<b class='flag-5'>SLAM</b><b class='flag-5'>系統</b>設計

    STM32F334比較器消和HRTIM的事件消功能如何實現?

    1,使用STM32F334制作的數字電源,用EVENT事件來實現逐周期電流檢測功能,現在開關管開通瞬間過沖較大,導致比較器誤觸發,比較器消功能直配置不起作用,不明白比較器的窗口消的PWM
    發表于 03-11 06:08