国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過場景l(fā)andmark做定位的新思路(CVPR 2022)

3D視覺工坊 ? 來源:3D視覺工坊 ? 作者:3D視覺工坊 ? 2022-12-16 11:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

主要內(nèi)容:提出了一種基于學習的相機定位算法,其無需存儲圖像特征和場景三維點云,降低了存儲限制,通過識別場景中稀疏但顯著有代表性的landmark來找到2D-3D對應(yīng)關(guān)系進行后續(xù)的魯棒姿態(tài)估計,通過訓練檢測landmark的場景特定的CNN來實現(xiàn)所提出的想法,即回歸輸入圖像中對應(yīng)landmark的2D坐標。

634694fc-7ce5-11ed-8abf-dac502259ad0.png

創(chuàng)新點與Contributions:1)與大多數(shù)landmark通常可見的人體姿態(tài)估計不同,由于相機視野有限并且無法同時觀察場景的不同部分,相機姿態(tài)估計任務(wù)中大多數(shù)場景l(fā)andmark不會同時可見,文章通過提出一種新的神經(jīng)方位估計器(Neural Bearing Estimator,NBE)來解決這一問題,該估計器可以直接回歸相機坐標系中場景l(fā)andmark的3D方位向量,NBE學習全局場景表示的同時學習預測場景l(fā)andmark的方向向量,即使它們不可見。 2)提出了一個新的室內(nèi)定位數(shù)據(jù)集,INDOOR-6,相對于傳統(tǒng)的7-Scenes室內(nèi)數(shù)據(jù)集,包含更多變化的場景、晝夜圖像和強烈的照明變化 3)與現(xiàn)有的無存儲定位方法相比,具有低存儲的優(yōu)點且性能較好 文章提出了兩種預測圖像中場景l(fā)andmark的方法,在第一種方法中訓練了一個模型來識別圖像中的2D場景地標,稱之為場景地標檢測器(SLD),由于假設(shè)已知的相機內(nèi)參,這些2D檢測可以轉(zhuǎn)換為3D方位矢量或射線。在第二種方法中訓練了一個不同的模型直接預測相機坐標系中l(wèi)andmark的3D方位向量,稱之為神經(jīng)方位估計器(NBE)。注:使用SLD,只能檢測到相機視場(FoV)中可見的landmark,而NBE預測所有l(wèi)andmark的方位,包括相機視場外不可見的landmark。

63d732a0-7ce5-11ed-8abf-dac502259ad0.png

首先會有一個SFM構(gòu)建的點云模型,會在這些點云中挑選出有代表性的點云子集,用這些子集以及建圖時SFM算法生成的數(shù)據(jù)庫圖像的偽真值來訓練兩個提出的網(wǎng)絡(luò)模型。SLD:SLD被設(shè)計為將RGB圖像I作為輸入并輸出一組像素似然圖(熱圖)表示每個可見地標的位置,其模型架構(gòu)如下:

68351844-7ce5-11ed-8abf-dac502259ad0.png

由四個主要組件組成:使用ResNet-18為backbone,刪除最后三個最大池化層以保留高分辨率特征圖(輸出分辨率為輸入圖像分辨率的四分之一),其次在ResNet-18之后使用擴張卷積塊,擴張率設(shè)置為1、2、3和4,接下來轉(zhuǎn)置卷積層執(zhí)行上采樣,并負責生成分辨率為輸入圖像一半的熱圖,最后一層由1×1卷積組成,預測L個熱圖通道,每個地標一個。 訓練損失:

684cdd6c-7ce5-11ed-8abf-dac502259ad0.png

在推斷過程中,假設(shè)當其最大熱圖值超過閾值τ=0.2時表明檢測到地標,利用亞像素精度計算熱圖峰值位置處裁剪的17×17 patch的期望值。NBE:設(shè)計了一個模型在給定圖像I的情況下回歸全部場景l(fā)andmark(即使它不可見)的方位向量。 CNN將圖像I作為輸入以生成深度特征圖,然后是多個MLP(多層感知器)塊,每個塊輸出指向landmark的方向向量,MLP包含兩個全連接層,具有128個ReLU激活節(jié)點。

686f7782-7ce5-11ed-8abf-dac502259ad0.png

6899dd88-7ce5-11ed-8abf-dac502259ad0.png

訓練好兩個模型后,將每個查詢圖像輸入SLD網(wǎng)絡(luò)以獲得2D檢測,然后根據(jù)內(nèi)參將其轉(zhuǎn)換為一組landmark方位向量B1,如果檢測到超過八個場景l(fā)andmark,使用魯棒最小解算器(P3P+RANSAC)計算相機姿態(tài),然后使用基于Levenberg-Marquardt的非線性細化。如果沒有8個,將相同的圖像輸入NBE網(wǎng)絡(luò)并獲得預測方位B2,然后合并方位估計B1和B2的集合以形成新的集合B3,當集合B1和B2中的方位指向同一地標時,保留來自B1的估計,因為SLD通常比NBE更準確。最后使用上面描述的相同過程但使用B3計算相機姿態(tài)。如何從點云中選擇有代表性的場景l(fā)andmark提供給網(wǎng)絡(luò)進行訓練?從SfM點云P中找到L個場景l(fā)andmark的最佳子集是一個組合問題,其中評估每個子集都是困難的。本文受之前以貪婪的方式尋找有區(qū)別的關(guān)鍵點或場景元素工作的啟發(fā),去選擇魯棒性(具有更長的軌跡)、可重復性(在多個場景中看到)和可概括性(從許多不同的觀看方向和深度觀察)的場景l(fā)andmark,測量軌跡長度大于閾值t的3D點x的顯著性得分A(x),如下所示:

68d42042-7ce5-11ed-8abf-dac502259ad0.png

除了最大化總體顯著性得分之外還尋找在空間上覆蓋3D場景的場景l(fā)andmark以便從場景內(nèi)的任何地方都可以看到一些地標,例如無論攝像機在場景中的哪個位置都希望一些地標可見。為此使用算法1中描述的約束貪婪方法

68e57806-7ce5-11ed-8abf-dac502259ad0.png

下圖表述一些挑選到的landmark在二維圖像中的投影的裁剪patch

68fb4a1e-7ce5-11ed-8abf-dac502259ad0.png

實驗:訓練模型的細節(jié)可去論文中查看 實驗數(shù)據(jù)集是在自己提出的INDOOR-6數(shù)據(jù)集和7Scenes數(shù)據(jù)集上

69223e26-7ce5-11ed-8abf-dac502259ad0.png

評估了單獨使用NBE, SLD,聯(lián)合使用NBE+SLD, NBE+SLD(E)(是更緊湊的網(wǎng)絡(luò)),和SOTA的基于分層定位方法結(jié)合HLoc+SLD Baseline為Posenet、DSAC、HLoc 在INDOOR-6數(shù)據(jù)集上的結(jié)果:

697d9d3e-7ce5-11ed-8abf-dac502259ad0.png

69c240b0-7ce5-11ed-8abf-dac502259ad0.png

存儲比較和消融研究:

6a35e38a-7ce5-11ed-8abf-dac502259ad0.png

7Scenes數(shù)據(jù)集上的實驗結(jié)果:

6a53983a-7ce5-11ed-8abf-dac502259ad0.png

總結(jié):算法是一種存儲要求低但精度高的方法。主要見解是在人和物體姿態(tài)估計中廣泛用于關(guān)鍵點檢測的現(xiàn)代CNN架構(gòu)也適用于檢測顯著的、場景特定的3D landmark。 實驗結(jié)果表明,其方法優(yōu)于以前的無存儲方法,但不如HLoc(頂級檢索和匹配方法之一)準確,但是HLoc需要高存儲。而且基于landmark的2D–3D對應(yīng)關(guān)系補充了HLoc的對應(yīng)關(guān)系,并且在計算姿態(tài)之前結(jié)合這些對應(yīng)關(guān)系進一步提高了HLoc精度。局限性:首先神經(jīng)網(wǎng)絡(luò)是特定于場景的,像其他學習方法一樣每個場景需要許多訓練圖像,而且在使用之前需要仔細選擇場景l(fā)andmark集。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107834
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4784

    瀏覽量

    98086
  • cnn
    cnn
    +關(guān)注

    關(guān)注

    3

    文章

    355

    瀏覽量

    23429

原文標題:通過場景l(fā)andmark做定位的新思路(CVPR 2022)

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    從智慧醫(yī)療到多元商業(yè)場景的室內(nèi)人員定位技術(shù)應(yīng)用詳解

    GPS室內(nèi)失效?藍牙信標定位技術(shù)應(yīng)運而生!通過信標部署、信號接收與算法解算,實現(xiàn)1–5米高精度定位。已廣泛應(yīng)用于智慧醫(yī)療(導診/設(shè)備管理)、文旅(智能導覽)、工業(yè)(安全監(jiān)控)、商業(yè)(尋車/精準營銷)等
    的頭像 發(fā)表于 03-02 17:16 ?526次閱讀

    Nullmax研發(fā)團隊靜態(tài)元素檢測和拓撲推理新成果入選CVPR 2026

    思路,顯著提升自動駕駛在無圖場景下的實時感知理解能力。Nullmax 致力于鞏固 ADAS 產(chǎn)品能力,為更多用戶提供全場景、可泛化、性能佳的智駕體驗。
    的頭像 發(fā)表于 02-28 10:08 ?474次閱讀

    數(shù)字音頻放大器新思路:MAX98360全方位解析

    數(shù)字音頻放大器新思路:MAX98360全方位解析 在數(shù)字化浪潮的推動下,音頻設(shè)備市場對音質(zhì)、效率和成本的要求日益嚴苛。在這個背景下,我們迎來了Analog Devices推出的MAX98360系列
    的頭像 發(fā)表于 01-16 14:15 ?172次閱讀

    北斗衛(wèi)星導航定位技術(shù)從核心誤差修正方法、不同定位模式到工業(yè)場景融合應(yīng)用詳解(二)

    斗系統(tǒng)通過“空間星座+地面控制+用戶終端”協(xié)同,以偽距測量和空間后方交會實現(xiàn)高精度定位。文章詳解六大誤差源及三層修正技術(shù),涵蓋開放、授權(quán)與增強三類定位模式,精度從米級至厘米級。結(jié)合UWB、藍牙等技術(shù),實現(xiàn)工業(yè)
    的頭像 發(fā)表于 12-30 17:02 ?702次閱讀

    室內(nèi)人員定位手環(huán)從核心技術(shù)的差異、核心功能、應(yīng)用場景及選購要點詳解

    室內(nèi)人員定位手環(huán)通過藍牙、UWB等技術(shù)實現(xiàn)精準定位,具備防拆、健康監(jiān)測、電子圍欄等功能,廣泛應(yīng)用于醫(yī)療、司法、倉儲等領(lǐng)域,本文從技術(shù)差異、功能、場景及選購要點全面解析,助力高效安全管理
    的頭像 發(fā)表于 12-23 16:41 ?1009次閱讀
    室內(nèi)人員<b class='flag-5'>定位</b>手環(huán)從核心技術(shù)的差異、核心功能、應(yīng)用<b class='flag-5'>場景</b>及選購要點詳解

    uwb人員定位卡的功能、原理和應(yīng)用場景詳解

    UWB人員定位卡基于超寬帶技術(shù),實現(xiàn)亞米級高精度定位,支持SOS報警、低功耗運行及多場景融合定位。廣泛應(yīng)用于工業(yè)、醫(yī)療、司法等領(lǐng)域,提升安全監(jiān)管與管理效率。
    的頭像 發(fā)表于 12-04 17:36 ?1586次閱讀
    uwb人員<b class='flag-5'>定位</b>卡的功能、原理和應(yīng)用<b class='flag-5'>場景</b>詳解

    開源鴻蒙技術(shù)大會2025丨定位與感知分論壇:構(gòu)建開源鴻蒙全場景定位感知用戶體驗

    在萬物智聯(lián)加速演進的當下,高精度定位、設(shè)備協(xié)同感知等技術(shù),將持續(xù)提升開源鴻蒙在移動設(shè)備導航、人員定位場景的用戶體驗。
    的頭像 發(fā)表于 11-20 17:34 ?858次閱讀
    開源鴻蒙技術(shù)大會2025丨<b class='flag-5'>定位</b>與感知分論壇:構(gòu)建開源鴻蒙全<b class='flag-5'>場景</b><b class='flag-5'>定位</b>感知用戶體驗

    GPS定位和地磁定位有什么區(qū)別?

    GPS定位和地磁定位是兩種原理完全不同、應(yīng)用場景也差異巨大的技術(shù)。簡單來說:GPS定位是絕對定位,告訴你“你在世界的哪個經(jīng)緯度”。地磁
    的頭像 發(fā)表于 11-19 12:01 ?517次閱讀
    GPS<b class='flag-5'>定位</b>和地磁<b class='flag-5'>定位</b>有什么區(qū)別?

    常見的室內(nèi)定位技術(shù)有哪些?深度剖析UWB、藍牙定位等技術(shù)的優(yōu)劣與應(yīng)用場景

    本文解析UWB、藍牙BLE、Wi-Fi三大室內(nèi)定位技術(shù)的原理、優(yōu)缺點及應(yīng)用場景,涵蓋高精度定位、低功耗部署與成本考量,助力選擇最優(yōu)方案。
    的頭像 發(fā)表于 11-17 16:45 ?2023次閱讀
    常見的室內(nèi)<b class='flag-5'>定位</b>技術(shù)有哪些?深度剖析UWB、藍牙<b class='flag-5'>定位</b>等技術(shù)的優(yōu)劣與應(yīng)用<b class='flag-5'>場景</b>

    毫米級定位+全場景記錄:鐵路高精度定位工作記錄儀助力鐵路線路巡查

    鐵路高精度定位工作記錄儀通過毫米級定位與全場景記錄技術(shù),實現(xiàn)了鐵路線路巡查的智能化升級,顯著提升了巡檢效率、安全性和數(shù)據(jù)可靠性,成為保障鐵路安全運營的關(guān)鍵工具。云翎智能高精度
    的頭像 發(fā)表于 10-20 22:02 ?438次閱讀
    毫米級<b class='flag-5'>定位</b>+全<b class='flag-5'>場景</b>記錄:鐵路高精度<b class='flag-5'>定位</b>工作記錄儀助力鐵路線路巡查

    諧波 THD 超標,如何通過監(jiān)測數(shù)據(jù)定位諧波源?

    ),從 “宏觀區(qū)域定位” 到 “微觀設(shè)備定位” 逐步縮小范圍。以下是基于監(jiān)測數(shù)據(jù)的具體定位方法,覆蓋工業(yè)、商業(yè)、電網(wǎng)等常見場景: 一、第一步:宏觀區(qū)域
    的頭像 發(fā)表于 09-23 11:43 ?1086次閱讀
    諧波 THD 超標,如何<b class='flag-5'>通過</b>監(jiān)測數(shù)據(jù)<b class='flag-5'>定位</b>諧波源?

    易控智駕榮獲計算機視覺頂會CVPR 2025認可

    近日,2025年國際計算機視覺與模式識別頂級會議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美國田納西州納什維爾召開。
    的頭像 發(fā)表于 07-29 16:54 ?1223次閱讀

    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍

    近日,在計算機視覺領(lǐng)域最具影響力的國際競賽 CVPR NTIRE 2025中,傳音多媒體團隊與上海交通大學圖像所MediaLab聯(lián)合團隊分別斬獲 高效超分辨率挑戰(zhàn)賽(NTIRE 2025
    的頭像 發(fā)表于 06-24 16:08 ?1636次閱讀
    傳音多媒體團隊攬獲<b class='flag-5'>CVPR</b> NTIRE 2025兩項挑戰(zhàn)賽冠亞軍

    輸電線路分布式故障定位裝置的原理、優(yōu)勢與應(yīng)用場景解析

    輸電線路分布式故障定位裝置的原理、優(yōu)勢與應(yīng)用場景解析
    的頭像 發(fā)表于 05-16 09:25 ?984次閱讀

    UWB 定位測距

    指示、可通過撥碼開關(guān)設(shè)置參數(shù),包括標簽還是基站的判別,地址的確定等。 應(yīng)用場景 :室內(nèi)定位、資產(chǎn)追蹤、智能倉儲等。 2、實物照 實物圖片UWB測距定位,UWB3000+Nrf52832
    發(fā)表于 05-12 09:36