点击上方“3D视觉工坊”,选择“星标” 干货第一时间送达
小黑导读
论文是学术研究的精华和未来发展的明灯。小黑决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容。个人能力有限,理解难免出现偏差,建议对文章内容感兴趣的读者,一定要下载原文,了解具体内容。
摘要
本文提出了一种新的图像与点云交叉模态配准方法DeepI2P。给定在同一场景中不同位置捕获的图像(例如来自rgb相机)和一般点云(例如来自3D激光雷达扫描仪),我们的方法估计了相机和激光雷达坐标帧之间的相对刚性变换。由于两种模式之间缺乏外观和几何关联,学习通用特征描述符来建立对应的配准本质上是具有挑战性的。我们通过将配准问题转化为分类和反摄像机投影优化问题来规避这个困难。设计了一种分类神经网络来标注点云中每个点的投影是在摄像机截锥内还是在摄像机截锥外。这些标记点随后被传递到一个新的反摄像机投影求解器来估计相对位姿。在Oxford Robotcar和KITTI数据集上的大量实验结果证明了我们的方法的可行性。
代码链接:https://github.com/lijx10/DeepI2P
论文创新点
本文的主要贡献如下:
-
我们规避了需要学习交叉模态特征描述符进行配准的挑战,将问题转化为两阶段分类和优化框架。
-
设计了一个具有注意模块的双分支神经网络来增强交叉模态融合,以学习三维点是在摄像机截锥内还是外的标签。
-
针对基于三维点分类标签的摄像机姿态问题,提出了摄像机反投影优化算法。
-
我们的方法和实验结果表明,可以在深度分类的情况下实现跨模态配准。
框架结构
我们的网络体系结构针对分类问题
实验结果
左边是基于特征的配准图,例如2D3D-MatchNet,右边是我们的无特征DeepI2P。我们将配准问题转化为分类问题,而不是跨模态检测和匹配特征。
从左到右迭代0 / 40 / 80时高斯-牛顿的可视化。绿色点划分为图像内视场。
三维可视化的截锥分类和反相机投影在Oxford (左)和KITTI (右)。
结论
提出了一种图像与点云的交叉模态配准方法。将具有挑战性的配准问题转化为用深度网络解决的分类问题和用最小二乘优化解决的反摄像机投影问题。利用Oxford和KITTI数据集验证了本文提出的分类优化框架的可行性。
论文链接:https://arxiv.org/pdf/2104.03501.pdf
每日坚持论文分享不易,如果喜欢我们的内容,希望可以推荐或者转发给周围的同学。
本文仅做学术分享,如有侵权,请联系删文。
下载1
在「3D视觉工坊」公众号后台回复:3D视觉,即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。
下载2
在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总,即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。
下载3
在「3D视觉工坊」公众号后台回复:相机标定,即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配,即可下载独家立体匹配学习课件与视频网址。
重磅!3DCVer-学术论文写作投稿 交流群已成立
扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群,目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。
一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号
3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:
学习3D视觉核心技术,扫描查看介绍,3天内无条件退款
圈里有高质量教程资料、可答疑解惑、助你高效解决问题
觉得有用,麻烦给个赞和在看~