一、前言
在上一篇文章中我们已经了解了VOC数据集的组织格式,如果我们想要训练自己的数据集,那么就可以按照VOC的格式来组织你的数据。
当然可能需要借助一些工具,这个以后有机会再说!!!
但是,官方的darknet
版本的yolov3、yolov4
所需的数据格式并不是这样的,我们还需要做一些转换。但是好消息是,我们可以利用一些python脚本来帮助我们快速完成格式转换!!!
前面说到,yolo的数据格式和voc的有一些不同,主要体现在类别和坐标信息的组织形式不同,也即前者并不是直接使用上一篇文章中说到的.xml
文件读取数据,而是使用以一定格式保存类别和坐标信息的.txt
文件来读取数据。那么yolo保存类别和坐标信息的格式具体是怎样的呢?见下图:
一个.txt
对应一张图片,并且它们的名字是一样的。
一行对应一个物体,第一部分是class_id,后面四个数分别是BoundingBox