天天影视网天天综合色,亚洲一本一道久久香蕉,国产日韩精品一区二区三区在线

摘要

由于深度信息的缺失，從單目圖像估計物體的準確3D位置是一個具有挑戰性的問題。之前的工作表明，利用目標的關鍵點投影約束來估計多個候選深度可以提高檢測性能。然而，現有方法只能利用垂直邊緣作為深度估計的投影約束。所以這些方法只利用了少量的投影約束，產生的深度候選不足，導致深度估計不準確。論文提出了一種可以利用來自任何方向邊緣的密集投影約束方法。通過這種方式，論文使用了更多的投影約束并輸出了更多的候選深度。此外，論文提出了一個圖匹配加權模塊來合并候選深度。本文提出的方法名為DCD（Densely Constrained Detector），在 KITTI 和 WOD基準上實現了最先進的性能。

之前算法存在的問題在于它們的幾何約束不足。具體來說，一些現有的方法估計2D邊界框和3D邊界框的高度，然后利用2D到3D高度投影約束生成目標的深度候選。最終的深度是通過對所有候選深度進行加權來生成的。如下圖所示，該方法僅適用于垂直邊緣，這意味著它們只使用少量約束和3D先驗，導致深度估計的不準確。

方法

DCD的框架的如下圖所示。DCD使用單階段檢測器從單目圖像中檢測目標。論文提出了密集幾何約束深度估計器（DGDE，Densely Geometric-constrained Depth Estimator），它可以計算任何方向的2D-3D邊緣的深度。DGDE可以有效地利用目標的語義關鍵點并產生更多的深度候選。此外，論文利用回歸得到的2D邊緣、3D邊緣和方向作為2D-3D邊緣圖匹配網絡的輸入。所提出的圖匹配加權模塊 (GMW，Graph Matching Weighting module) 匹配每個2D-3D邊緣并輸出匹配分數。通過將多個深度與其相應的匹配分數相結合，論文最終可以為目標生成一個穩健的深度。

Geometric-based 3D Detection Definition

基于幾何的單目3D目標檢測通過2D-3D投影約束估計目標的位置。具體來說，網絡預測目標的尺寸()，旋轉角。假設一個目標有n個語義關鍵點，論文回歸第i個關鍵點在圖像坐標中的2D坐標和object frame中的3D坐標。object frame的坐標原點是目標的中心點。給定n個語義2D-3D關鍵點投影約束，解決3D目標位置是一個超定問題，它是用于將點云將從object frame轉換到camera frame的平移向量。生成每個目標的語義關鍵點的方法改編自。論文通過PCA建立了一些汽車模型，并通過從點云和2D mask中分割出來的3D點云來細化模型。在獲得關鍵點后，就可以使用DGDE從關鍵點投影約束中估計目標的深度。

Densely Geometric-constrained Depth Estimation

雖然以前的深度估計方法[51]只考慮了垂直邊緣，但DGDE可以處理任意方向的邊緣。因此，論文能夠利用更多的約束來估計每個深度候選的深度。

該方法基于關鍵點從3D空間到2D圖像的投影關系。第i個關鍵點的3D坐標在object frame中定義，并通過以下等式投影到2D圖像平面上：