【转载备份】目标检测两种常用的数据集COCO和VOC
背景:
今天跟着我们算法工程师学了几分钟的算法模型训练,她讲到目标检测常用的数据集是COCO和VOC,我不知道啥是数据集,更加不知道这两个是什么,它们有什么用,于是我简单了解了一下子~
要解决的问题:
- 什么是数据集?
- COCO和VOC是什么?
- 它们分别是什么格式?
问题1:什么是数据集?
- 数据集,其字面意思,就是由数据组成的集合。
- 数据集通常包含了用来训练和验证模型的样本数据,这些数据可以是数字、文本、图像、音频或视频等形式的数据。
- 数据集用于训练算法模型,使模型能够学习到数据中的模式和规律。
- 数据集通常被划分为训练集、验证集和测试集三个子集。
-
训练集用于训练机器学习模型,验证集用于选择和调整模型的超参数和结构,测试集用于评估模型的性能和准确度。
问题2:COCO和VOC是什么?
- VOC数据集指的是Visual Object Classes数据集,是一个用于目标检测和图像分割任务的常用数据集之一。这个数据集最初由英国牛津大学的计算机视觉小组创建,旨在帮助研究人员开发和评估目标检测和图像分割算法。VOC数据集中包含20种常见的物体类别,例如人、车、狗、猫等。关于为什么叫VOC,可能是因为其最初目的是识别和分类视觉对象(Visual Object Classes)。
-
COCO数据集是指Common Objects in Context数据集,是一个用于目标检测、图像分割和图像标注任务的知名数据集。COCO数据集由微软研究院创建,旨在提供更广泛的物体类别和更丰富的场景上下文,以促进计算机视觉领域的研究。
关于为什么叫COCO,据说是因为该数据集的目标是识别和理解“在上下文中的常见物体”(Common Objects in Context),因此得名COCO。这个数据集包含了80个不同的物体类别,如人、车、飞机、动物等,以及大量的图像和对应的注释信息,被广泛应用于目标检测、图像分割和图像标注等任务的评估和研究。
问题3:它们分别是什么格式?
- VOC数据集的标注格式是XML。每个图像对应一个XML文件。
- COCO数据集的标注格式是JSON或txt。所有的目标框标注都在同一个JSON或txt里。
参考资料:
原博客链接:https://www.cnblogs.com/tully/p/18057834
什么是数据集?https://blog.csdn.net/weixin_52093896/article/details/130070130
目标检测任务中常用的数据集格式(voc、coco、yolo) https://blog.csdn.net/weixin_45277161/article/details/130331788
目标检测数据集PASCAL VOC详解 https://zhuanlan.zhihu.com/p/362044555