基本情况
- 题目:Towards unified depth and semantic prediction from a single image
- 出处:Wang, P., Shen, X., Lin, Z., Cohen, S., Price, B., & Yuille, A. L. (2015). Towards unified depth and semantic prediction from a single image. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 2800-2809).
深度估计和语义分割是图像理解中的两个基本问题。虽然这两项任务紧密相关且互惠互利,但它们通常是分开或顺序解决的。基于这两个任务的互补性,我们提出了一个联合深度和语义预测的统一框架。给定一幅图像,我们首先使用训练好的卷积神经网络(CNN)来联合预测由像素深度值和语义标签组成的全局布局。通过允许深度和语义信息之间的交互,联合网络提供了比仅为深度预测[6]训练的最先进的CNN更准确的深度预测。为了进一步获得精细层次的细节,在全局布局的指导下,将图像分解为局部分割,进行区域层次深度和语义预测。利用像素全局预测和区域局部预测,我们将推理问题建立在一个两层层次条件随机场(HCRF)中