数据集格式--coco、voc、yolo
数据集格式--coco
COCO数据集现在有3种标注类型,分别是:
- object instances(目标实例)
- object keypoints(目标上的关键点)
- image captions(看图说话)
这3种类型共享这些基本类型:info、image、license,使用JSON文件存储。
数据集格式--voc
VOC数据集由五个部分构成:
- JPEGImages:存放的是训练与测试的所有图片。
- Annotations:里面存放的是每张图片打完标签所对应的XML文件。
- ImageSets:ImageSets文件夹下本次讨论的只有Main文件夹,此文件夹中存放的主要又有四个文本文件test.txt、train.txt、trainval.txt、val.txt, 其中分别存放的是测试集图片的文件名、训练集图片的文件名、训练验证集图片的文件名、验证集图片的文件名。
- SegmentationClass与SegmentationObject:存放的都是图片,且都是图像分割结果图,对目标检测任务来说没有用。class segmentation 标注出每一个像素的类别
- object segmentation 标注出每一个像素属于哪一个物体。
数据集格式--yolo
yolo数据集标注格式主要是 U版本yolov5项目需要用到。
标签使用txt文本进行保存。
yolo标注格式如下所示:
<object-class> <x> <y> <width> <height>
- <object-class>:对象的标签索引
- x,y:目标的中心坐标,相对于图片的H和W做归一化。即x/W,y/H。
- width,height:目标(bbox)的宽和高,相对于图像的H和W做归一化。