论文标题:MonoJSG:Joint Semantic and Geometric Cost Volume for Monocular 3D Object Detection
作者:Qing Lian(HKUST) ,Peiliang Li(DJI,VINS-Mono二作), Xiaozhi Chen(DJI)
来源:CVPR 2022
论文链接:https://arxiv.org/abs/2203.08563
Code:https://github.com/lianqing11/MonoJSG(代码即将开源)
整理:高斯球
一、引言动机:由于 2D-3D 投影固有的不适定性,单目 3D 物体检测缺乏准确的深度恢复能力;尽管深度神经网络 (DNN) 能够从高级学习特征进行单目深度感知,但由于深度卷积机制,像素级线索通常被忽略;
论文简述:作者将单目物体深度估计重新表述为渐进改进问题,并提出联合语义和几何代价量来对深度误差进行建模,该方法利用像素级视觉线索来改进边界框提