基本信息
- 题目: Deep Residual Learning for Image Recognition
- 作者: Kaiming He , Xiangyu Zhang , Shaoqing Ren , Jian Sun
- Microsoft Research
- 出处: He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep residual learning for image recognition. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 770-778).
更深的神经网络更难训练。我们提出了一种残差的学习框架,以简化比以前使用的网络更深入的网络训练。我们显式地将层重新配置为参考层输入学习剩余函数,而不是学习未参考函数。我们提供了全面的经验证据,表明这些残差网络更易于优化,并且可以通过深度的增加而获得准确性。在ImageNet数据集上,我们评估深度最大为152层的残差网络-比VGG网络[41]深8倍,但复杂度仍然较低。这些残留网络的整体在ImageNet测试仪上实现了3.57%的误差。该结果在ILSVRC 2015分类任务中获得第一名。我们还介绍了具有100和1000层的CIFAR-10的分析。表示的深度对于许多视觉识别任务至关重要。仅由于我们的深度表示,我们在COCO对象检测数据集上获得了28%的相对改进。深度残差网是我们提交ILSVRC和COCO 2015竞赛1的基础,在这些竞赛中,我们还获得了ImageNet检测,ImageNet本地化,COCO检测和COCO分割等任务的第一名。
网络结构