基本情况
- 题目:Learning depth from single monocular images
- 出处:Saxena, A., Chung, S. H., & Ng, A. Y. (2006). Learning depth from single monocular images. In Advances in neural information processing systems (pp. 1161-1168).
我们考虑了从单目图像进行深度估计的任务。针对这个问题,我们采用了一种监督学习方法,首先收集一组单目图像(包括森林、树木、建筑物等非结构化室外环境的图像)和它们对应的地真深度图。然后,我们应用监督学习来预测深度图作为图像的函数。深度估计是一个具有挑战性的问题,因为局部特征单独不足以估计一个点的深度,需要考虑图像的全局上下文。我们的模型使用了一种判别训练的马尔可夫随机场(MRF),它包含了多尺度的局部和全局图像特征,并对个别点的深度以及不同点深度之间的关系进行建模。我们表明,即使是在非结构化场景中,我们的算法经常能够恢复相当准确的深度地图。
2 介绍从图像中恢复三维深度是计算机视觉的一个基本问题,在机器人技术、场景理解和三维重建等领域有着重要的应用。 视觉三维重建的大部分工作都集中在双目视觉(立体视觉)[1]和其他需要多幅图像的算法上,如运动[2]的结构和离焦[3]的深度。 单目图像深度估计是一项困难的任务,要求我们考虑图像的全局结构,并利用对场景的先验知识。 在本文