【转载备份】目标检测两种常用的数据集COCO和VOC

 

背景:

今天跟着我们算法工程师学了几分钟的算法模型训练,她讲到目标检测常用的数据集是COCO和VOC,我不知道啥是数据集,更加不知道这两个是什么,它们有什么用,于是我简单了解了一下子~

要解决的问题:

  •  什么是数据集?
  • COCO和VOC是什么?
  • 它们分别是什么格式?

问题1:什么是数据集?

  • 数据集,其字面意思,就是由数据组成的集合
  • 数据集通常包含了用来训练和验证模型的样本数据,这些数据可以是数字、文本、图像、音频或视频等形式的数据
  • 数据集用于训练算法模型,使模型能够学习到数据中的模式和规律。
  • 数据集通常被划分为训练集、验证集和测试集三个子集
  • 训练集用于训练机器学习模型,验证集用于选择和调整模型的超参数和结构,测试集用于评估模型的性能和准确度。

 

问题2:COCO和VOC是什么?

  • VOC数据集指的是Visual Object Classes数据集,是一个用于目标检测和图像分割任务的常用数据集之一。这个数据集最初由英国牛津大学的计算机视觉小组创建,旨在帮助研究人员开发和评估目标检测和图像分割算法。VOC数据集中包含20种常见的物体类别,例如人、车、狗、猫等。关于为什么叫VOC,可能是因为其最初目的是识别和分类视觉对象(Visual Object Classes)。

 

  • COCO数据集是指Common Objects in Context数据集,是一个用于目标检测、图像分割和图像标注任务的知名数据集。COCO数据集由微软研究院创建,旨在提供更广泛的物体类别和更丰富的场景上下文,以促进计算机视觉领域的研究。

    关于为什么叫COCO,据说是因为该数据集的目标是识别和理解“在上下文中的常见物体”(Common Objects in Context),因此得名COCO。这个数据集包含了80个不同的物体类别,如人、车、飞机、动物等,以及大量的图像和对应的注释信息,被广泛应用于目标检测、图像分割和图像标注等任务的评估和研究。

问题3:它们分别是什么格式?

  • VOC数据集的标注格式是XML。每个图像对应一个XML文件。
  • COCO数据集的标注格式是JSON或txt。所有的目标框标注都在同一个JSON或txt里。

 

 

参考资料:

原博客链接:https://www.cnblogs.com/tully/p/18057834

什么是数据集?https://blog.csdn.net/weixin_52093896/article/details/130070130 

目标检测任务中常用的数据集格式(voc、coco、yolo)  https://blog.csdn.net/weixin_45277161/article/details/130331788

目标检测数据集PASCAL VOC详解 https://zhuanlan.zhihu.com/p/362044555

posted @ 2024-06-23 11:37  o蹲蹲o  阅读(69)  评论(0编辑  收藏  举报