【摘要】3D視覺定位指的是根據(jù)事先構(gòu)建的3D模型及相關(guān)信息,計算取得某張圖像在拍攝時相機的位置和姿態(tài)。這是3D視覺的一項十分重要的技術(shù),可以用來幫助實現(xiàn)人員定位與導(dǎo)航。本博文將基于2019年CVPR論文From Coarse to Fine: Robust Hierarchical Localization at Large Scale所采用的分級定位方案對該技術(shù)進行簡要的介紹。基本原理3D.。.
引言
所謂3D視覺定位指的是根據(jù)事先構(gòu)建的3D模型及相關(guān)信息,計算取得某張圖像在拍攝時相機的位置和姿態(tài)。這是3D視覺的一項十分重要的技術(shù),可以用來幫助實現(xiàn)人員定位與導(dǎo)航。本博文將基于2019年CVPR論文From Coarse to Fine: Robust Hierarchical Localization at Large Scale所采用的分級定位方案對該技術(shù)進行簡要的介紹。
基本原理
3D視覺定位的直接目標是計算當前圖像的照相機位姿,解決該問題的直接方案是建立3D點與2D點之間的匹配關(guān)系,通過二者的匹配關(guān)系估計相機位姿,這一問題被稱作PnP(Pespective-n-Point)問題。求解PnP問題的方法有很多,常見的有P3P、EPnP、UPnP等,具體的如何實現(xiàn)本文不做介紹,讀者可以自行搜索PnP問題的相關(guān)理論。而視覺定位需要解決的一大關(guān)鍵問題是如何建立3D點與2D點之間的匹配關(guān)系。對于這一點,論文作者Sarlin提出過一種分級定位的方案,以下將詳細介紹該方案。
分級定位

分級定位的框架大約可以分成三步:預(yù)檢索、共視聚類、局部匹配與定位。
預(yù)檢索
預(yù)檢索的意義在于獲取前k張與當前圖像最相似的圖像,判斷相似的依據(jù)通常是通過匹配圖像的全局特征。一般而言,產(chǎn)生全局特征的方法可以依賴于局部特征所組成的詞袋,不過近些年,一些深度學(xué)習(xí)方案也被引入了進來,例如NetVLAD或更加輕量級的MobileNetVLAD。最終通過獲取當前圖像的全局特征的k個最近鄰來獲取預(yù)檢索得到的相近圖集。
共視聚類
然而由于可能產(chǎn)生的錯誤匹配,所獲取到的預(yù)檢索圖集并不一定全部都面向同一場景,這時就需要先將面向不同場景的圖像區(qū)分開來,這項技術(shù)就被稱作共視聚類,簡而言之就是將具有共視關(guān)系的圖像聚成一類。

這一過程實際十分簡單,它是通過匹配同名點來獲取的,這些同名點在早先進行的3D建模過程中通過特征的提取與匹配已經(jīng)建立了對應(yīng)的關(guān)系。若兩個圖像中存在穩(wěn)定的同名點,則認為二者共視,分成一類,否則分成兩類。
局部匹配與定位
一般認為圖像數(shù)量較多的類所對應(yīng)的場景是正確場景的可能性較大。因此從這一場景開始,嘗試獲取相機位姿。獲取的方式主要依賴求解PnP問題,因此需要首先構(gòu)建當前圖像的2D關(guān)鍵點在3D模型中的坐標位置。在尚不知道相機姿態(tài)前,這一信息的獲取需要首先匹配當前圖像和場景內(nèi)的圖像,特別要匹配那些能夠?qū)?yīng)到3D位置的2D特征點,若能夠匹配上則確定了當前圖像中的2D點和3D點的對應(yīng)關(guān)系,繼而即可通過對PnP問題的求解獲取相機位姿。
總結(jié)
本博文基于當前被廣泛采用的分級視覺定位方法對在3D視覺領(lǐng)域廣泛使用的視覺定位方法進行了簡要介紹,其主要可以被分為三個步驟,即預(yù)檢索、共視聚類、局部匹配與定位,最終通過求解PnP問題來獲取當前圖像的位姿,從而確定拍攝者的位置。筆者后續(xù)將繼續(xù)保持對3D視覺領(lǐng)域的研究和關(guān)注,并繼續(xù)輸出相關(guān)博文。
編輯:lyn
-
定位
+關(guān)注
關(guān)注
5文章
1587瀏覽量
36695 -
3D模型
+關(guān)注
關(guān)注
1文章
79瀏覽量
16886 -
3D視覺
+關(guān)注
關(guān)注
4文章
483瀏覽量
29218
發(fā)布評論請先 登錄
人形機器人 3D 視覺路線之爭:激光雷達、雙目和 3D - ToF 誰更勝一籌?
友思特技術(shù) | 智能iToF技術(shù):開啟高性價比3D視覺新紀元
3D視覺引導(dǎo)拆碼垛:一文讀懂“機器眼”如何指揮機器人搬貨?
基于3D視覺引導(dǎo)的移動式復(fù)合機器人設(shè)計:智能自動化革命的核心技術(shù)
DLPC1438:TI DLP? 3D 打印機數(shù)字控制器的全面解析
2025 3D機器視覺的發(fā)展趨勢
3D 視覺系統(tǒng)供應(yīng)商全景解析:技術(shù)迭代與國產(chǎn)力量的崛起
友思特應(yīng)用 | 基于高精度雙目散斑 3D 相機的放射治療視覺定位應(yīng)用
奧比中光3D視覺技術(shù)賦能IROS 2025研究成果
奧比中光領(lǐng)跑韓國機器人3D視覺市場
季豐電子邀您相約2025國際3D視覺感知與應(yīng)用大會
iTOF技術(shù),多樣化的3D視覺應(yīng)用
3D視覺引導(dǎo)技術(shù):開啟工業(yè)自動化“慧眼時代”的變革引擎
3D視覺引領(lǐng)工業(yè)變革
昨日,杭州3D視覺傳感器公司獲數(shù)億元融資!
關(guān)于3D視覺定位技術(shù)詳細解析
評論