PASCAL VOC为图像识别和分类提供了一整套标准化的优秀数据集,从2005年到2012年每年都会举行一场图像识别challenge。我们可以从这里VOC数据集下载地址下载VOC数据集,主要分为两个年份:2007、2012。
下载完成后,解压,会发现文件夹的内容如下所示: 对于目标检测,我们只需要关注前三个文件夹:
Annotations、ImageSets和JPEGImages
即可。下面就来说一下这三个文件夹的具体内容。
VOCdevkit
——VOC2007 #文件夹的年份可以自己取,但是要与你其他文件年份一致,看下一步就明白了
————Annotations #放入所有的xml文件
————ImageSets
——————Main #放入train.txt,val.txt文件
————JPEGImages #放入所有的图片文件