随着深度学习的快速发展,视觉稠密建图和定位技术从传统的基于手工特征点的检测、匹配加之数值优化,发展到现在的基于深度神经网络的特征检测、匹配和学习优化(Learning to Optimize),近些年涌现出了很多新的方法。
在这次分享中,我们邀请到了阿里云人工智能实验室算法团队负责人朱思语,分享他们最新的基于深度神经网络的密集特征匹配、不依赖场景的视觉定位以及基于深度递归优化器的运动恢复结构(Structure from Motion)等工作。最后会对基于视觉的建图和定位技术未来发展的趋势做简要总结。
论文列表: 1.Learning Camera Localization via Dense Scene Matching- 基于稠密场景匹配的相机定位学习
- 论文地址:https://arxiv.org/abs/2104.14545
- 相机定位算法是SLAM或者增强现实的一部分,主要有基于回归和基于结构两种,基于回归的定位算法精度较低,现在比较流行的是基于结构的相机定位算法,基于结构的定位算法有两个阶段:1、建立二维图像与三维场景点之间的对应关系;2、估计相机位姿。对于SLAM来说,相机定位算法属于前端工作,是视觉里程计的一部分