来自不同行业领域的50多个对象检测数据集
作者|Abhishek Annamraju
编译|Flin
来源|medium
计算机视觉是一个快速发展的领域,每天都有大量的新技术和算法出现在不同的会议和期刊上。说到目标检测,理论上你会学到很多算法,比如Faster-rcnn、Mask rcnn、Yolo、SSD、Retinenet、级联rcnn、Peleenet、EfficientDet、CornerNet…。这张算法清单是永远列不完的!
通过将其应用到不同的数据集来巩固你的学习经验总是有益的!!!
这样一来,你往往会更好地理解算法,并且可以直观了解哪些算法可以在哪种数据集上运行。
我们在Monk Computer Vision Org的开源团队编制了一个对象检测,图像分割和动作识别数据集的列表,并针对每个对象创建了简短的教程,供你使用这些数据集并尝试不同的对象检测算法
下面提到的是对象检测数据集的简短列表,有关它们的简短详细信息以及使用它们的步骤。数据集来自以下领域:
★农业
★高级驾驶员辅助和自动驾驶汽车系统
★时尚,零售和营销
★野生动物
★体育
★卫星成像
★医学成像
★安全和监视
★水下成像
….. 以及更多!!!!!
完整列表可在github上找到相关的使用说明和训练代码
与农业有关的数据集
A)Winegrape检测数据集
*目标:检测葡萄园中的葡萄簇
*应用:监测生长并分析产量
*详细信息:300幅图像,带有5个葡萄类别的4400个边界框
*如何利用数据集并使用YoloV3管道构建自定义检测器
B)全球小麦检测数据集
*目标:检测田间的小麦作物
*应用:监测生长并分析产量
*详细信息:带有100K +批注的3430图像
*如何利用数据集并使用EfficientDet-D4管道构建自定义检测器
先进的驾驶员辅助和自动驾驶汽车系统相关数据集
A)LISA交通标志检测数据集
*目标:用于检测和分类行车记录仪图像中的交通标志
*应用:交通标志识别是自动驾驶的规则设置程序
*详细信息:在47种美国标志类型上的6610帧上有7855个注释
*如何利用数据集并建立自定义使用EfficientDet-D3管线的探测器
*此存储库又多了一个数据集
B)低光照条件下的物体检测
*目标:在低光照条件下检测道路上的物体——雾,雾霾,下雨等
*应用:这是自动驾驶汽车中的重要组成部分,因为它能够检测物体,因此在不利条件下属于更安全的车辆
*细节:在12种不同对象类型上的7500帧上的15K +注释
*如何利用数据集和使用EfficientDet-D3管道构建自定义检测器
C)LARA交通灯检测数据集
*目标:检测交通信号灯并将其分类为红色,绿色和黄色
*应用程序:可以为道路网络交叉口的adas和自动驾驶汽车系统设置规则
*详细信息:三种交通类型的11K帧和20K +注释灯光
*如何利用数据集并建立使用Mmdet-Faster-Rcnn-fpn50管道自定义检测
D)使用红外图像进行人检测
*目标:用于检测红外图像中的人
*应用:自动驾驶汽车配备了红外摄像头以检测恶劣条件下的物体
*详细信息:30个带有1K +注释的视频序列
*如何利用数据集并使用Mx-Rcnn管道构建自定义检测器
E)坑洼检测数据集
*目标:从道路图像中检测坑洼
*应用:检测道路地形和坑洼可实现平稳行驶。
*详细信息: 700个在坑洼处带有3K +注释的图像
*如何利用数据集和使用M-Rcnn管道构建自定义检测器
F)Nexet车辆检测数据集
*目标:检测车辆的道路图像
*应用:检测车辆是自动驾驶的主要组成部分
*详细信息:7000种图像,在6种类型的车辆上具有15K +注释
*如何利用数据集并使用Tensorflow Object Detection构建自定义检测器API
G)BDD100K Adas数据集
*目标:检测道路上的物体
*应用:检测车辆,交通标志和人是自动驾驶的主要组成部分
*详细信息:100K图像,对10种类型的对象提供250K +注释
*如何利用数据集并建立自定义使用Tensorflow对象检测API的检测器
H)Linkopings交通标志数据集
*目标:检测图像中的交通标志
*应用:检测交通标志是了解交通规则的第一步
*详细信息:3K图像,对40多种类型的交通标志提供5K +注释
**如何利用数据集并使用Mmdet-Cascade Mask-Rcnn构建自定义检测器
时尚、零售和营销相关数据集
A)广告牌检测(二次采样OpenImages数据集)数据集
*目标:检测图像中的广告牌
*应用程序:检测广告牌是自动分析整个城市营销活动的关键部分
*详细信息:2K图像,广告牌上带有5K +注释
*如何利用数据集并使用Retinanet构建自定义检测器
B)DeepFashion2时尚元素检测数据集
*目标:检测图像中的时尚产品,服装和配饰
*应用程序:应用程序时尚检测有着从数据排序到推荐引擎的巨大应用
*详细信息:490K图像,带有约100个注释对象类
*如何利用数据集并建立自定义CornetNet-Lite管道检测仪
*另一个与时尚相关的数据集是淘宝商品数据集
C)Qmul-OpenLogo徽标检测数据集
*目标:检测自然图像中的不同徽标
*应用:分析视频和自然场景中徽标出现的频率对营销至关重要
*详细信息:16K训练图片,包括各种品牌的标识——食品、车辆、连锁餐厅、送货服务、航空公司等
*如何利用数据集并使用mx-rcnn管道构建自定义检测器
与体育相关的数据集
A)足球检测数据集(从OpenImages数据集进行二次采样)
*目标:在视频中跨帧检测足球
*应用:检测足球位置在越位等自动分析情况中至关重要
*详细信息:约3K训练图像。
*如何利用数据集并使用yolo-v3管道构建自定义检测器
B)扑克牌类型检测
*目标:检测自然图像中的纸牌并分类纸牌类型
*应用:可能的应用是分析不同纸牌游戏的获胜几率
*详细信息:52种纸牌类型中500张以上的图像
*如何利用数据集并建立自定义使用mx-rcnn管道的检测器
C)热图像中的足球运动员检测
*目标:使用热图像定位和跟踪玩家
*应用:跟踪游戏中的玩家是生成分析的关键部分
*详细信息:超过5K +注释的3K +图像。
*如何利用数据集和使用mmdet quick-rcnn管道构建自定义检测器
与安全和监视相关的数据集
A)CCTV交通摄像头中的MIO-TCD车辆检测
*目标:检测闭路电视摄像机中的车辆
*应用:检测闭路电视摄像机中的车辆是安全监控应用中的关键部分
*详细信息:113K图像,在5种以上类型的车辆上具有200K +注释
*如何利用数据集并使用Mmdet-Retinanet管道构建自定义检测器
B)WIDER人员检测数据集
*目标:在闭路电视和自然场景图像和视频中检测人员
*应用:基于CCTV的人员检测构成安全和监视应用程序的核心
*详细信息:10K +图像以及20K +注释可检测行人
*如何利用数据集并建立自定义使用Cornernet-Lite管道的探测器
C)防护装备-头盔和背心检测
*目标:检测人员的头盔和背心
*应用:这是安全合规性监视中不可或缺的一部分
*详细信息:1.5K +图像以及2K +注释可检测人员,头盔和背心
*如何利用数据集和构建自定义检测器使用Mmdet — Cascade RPN
D)视频中的异常检测
*目标:根据视频中执行的操作对视频进行分类
*应用:实时检测异常有助于阻止犯罪
*详细信息:对应于10个异常类别的1K +视频。
*如何利用数据集和使用mmaction-tsn50管道构建自定义分类器
医学影像数据集
A)超声臂丛神经(BP)神经分割数据集
*目标:在超声图像中分割某些神经类型
*应用:通过使用可阻塞或减轻源头疼痛的留置导管,有助于改善疼痛管理。
*详细信息: 11K +图像以及相关的实例蒙版,用于检测神经
*如何利用数据集并构建自定义检测器
B)细胞中的PanNuke癌症实例分割
*目标:在幻灯片图像中分割不同的细胞类型
*应用程序:自动分析兆字节数据中癌细胞和死细胞的存在
*详细信息:3K+图像,带有用于检测不同单元类型的关联实例掩码
*如何利用数据集和构建定制检测器
卫星成像数据集
A)卫星图像中的道路分割
*目标:在卫星图像中分割道路线
*应用:帮助城市规划和道路监控
*详细信息:1K +图像和相关实例遮罩可检测不同的道路区域
*如何利用数据集并构建自定义检测器
B)在合成生成的月球图像中的可穿越区域分割
*目标:分割岩石并在月球影像中找到可穿越的区域
*应用:自主漫游车路径规划中的基本元素
*详细信息:带有相关实例蒙版的10K +图像以检测不同的岩石和平坦的地面
*如何利用数据集并构建定制检测器
C)卫星影像中的汽车和游泳池检测
*目标:在卫星图像中检测车辆和游泳池
*应用:这是财产税估算中的关键部分
*详细信息:3.5K+图片,汽车和游泳池上有5K+注释标签
*如何利用数据集并使用cornernet lite管道构建自定义检测器
D)航空影像中的道路和居民区分割
*目标:在卫星图像中分割道路和居民区
*应用:这是财产税估算中的关键部分
*详细信息:带有分割蒙版的100幅超高分辨率图像
*如何利用数据集和构建自定义检测器
*另一个类似的道路分割数据集和相关的训练代码
- 数据集:https://www.kaggle.com/srikaranand/road-segmentation-dataset
- 训练代码:https://github.com/Tessellate-Imaging/Monk_Object_Detection/blob/master/application_model_zoo/Example - Road Segmentation in Satellite Images - 2.ipynb
E)卫星图像中的水体分割
*目标:在卫星图像中分割水体
*应用:了解水体如何随时间变化和演变非常重要
-带有分割蒙版的100幅超高分辨率图像
*如何利用数据集并构建自定义检测器
*另一个此类数据集是DeepGlobe土地覆盖分类及其相关的使用准则
- 数据集:https://competitions.codalab.org/competitions/18468#participate-get_starting_kit
- 相关使用准则:https://github.com/Tessellate-Imaging/Monk_Object_Detection/blob/master/application_model_zoo/Example - DeepGlobe Land Cover Classification.ipynb
野生动物相关数据集
A)老虎检测数据集(从OpenImages采样)
*目标:检测自然和无人机图像中的老虎
*应用:监视濒临灭绝的物种
*详细信息:带有4k +注释的2K +图像。
*如何利用数据集和使用Cornernet-lite管道构建自定义检测器
*另外一个这样的数据集可以是猴子检测数据集及其相关的教程
- 猴子检测数据集:https://storage.googleapis.com/openimages/web/index.html
- 相关的教程:https://github.com/Tessellate-Imaging/Monk_Object_Detection/blob/master/application_model_zoo/Example - Monkey detection in the wild.ipynb
B)斑马和长颈鹿检测数据集
*目标:检测自然和无人机图像中的斑马和长颈鹿物种
*应用:监视濒危物种
*详细信息:带有5k +注释的5K +图像。
*如何使用数据集并使用efficiencydet-d3管道构建自定义检测器
C)加州理工学院相机陷阱数据集
*目标:检测陷阱照相机类型图像中的动物
*应用:监视濒临灭绝的物种
*详细信息:带有8k +注释的10K +图像。
*如何利用数据集并使用Retinanet管道构建自定义检测器
*另外一个这样的相机数据集和相关的训练代码
- 数据集:https://github.com/Tessellate-Imaging/Monk_Object_Detection/blob/master/application_model_zoo/Example - Cameratrap Animals Detection - 1.ipynb
- 训练代码:https://github.com/Tessellate-Imaging/Monk_Object_Detection/blob/master/application_model_zoo/Example - Cameratrap Animals Detection - 1.ipynb
D)大象检测数据集(从COCO数据集中采样)
*目标:检测自然和无人机图像中的大象种类
*应用:监视濒临灭绝的物种
*详细信息:带有5k +注释的5K +图像。
*如何利用数据集并使用mmdet-maskrcnn构建自定义检测器
水下数据集
A)在野外发现海龟
*目标:检测水下图像中的海龟
*应用:监视濒危物种
*详细信息:带有5k +注释的5K +图像。
*如何利用数据集并使用有效数据量构建自定义检测器
*类似的数据集,可监控水下鱼类
相关代码
B)水下垃圾检测数据集
*目标:检测海洋垃圾
*应用:监视和控制海洋垃圾问题
*详细信息:带有5k +注释的2K +图像。
*如何利用数据集并使用有效数据量构建自定义检测器
*更复杂的基于像素的垃圾分类数据集和相关代码
- 垃圾分类数据集:https://conservancy.umn.edu/handle/11299/214865
- 相关代码:https://github.com/Tessellate-Imaging/Monk_Object_Detection/blob/master/application_model_zoo/Example - SUIM Dataset Underwater Object Segmentation.ipynb
C)SUIM水下物体检测数据集
*目标:分割水下物体
*应用:自主水下航行器的路径规划,跟踪潜水员和监视海洋物种
*详细信息:1.5K +图像和1.5k +注释蒙版。
*如何利用数据集并构建自定义检测器
D)咸淡的水下鱼类识别数据集
*目标:检测水下图像中的海洋物种。
*应用程序:监视海洋物种
*详细信息:89个视频以检测鱼类,螃蟹,虾,水母,海星
*如何利用数据集并使用mmdet构建自定义检测器——Faster-rcnn管道
文本分析相关的数据集
A)文档布局检测数据集
*目标:检测文档布局以进行进一步分析
*应用:必不可少的将图像分割成不同的部分,以便可以进一步应用基于规则的NLP和文本识别的功能。
*详细信息:5K +图像,带有10k +批注的标签,如段落,图像,标题。
*如何利用数据集并使用mx-rcnn构建自定义检测器
*在名为IIIT-AR-13K的文档中存在用于图形组件检测的非常相似的数据集,这是如何利用数据集并在其上训练模型的方法
B)总文字数据集
*目标:在自然场景中定位文本
*应用程序:使用OCR识别的基本组件
*详细信息:带有5K +多边形注释的1.5K +图像
*如何利用数据集和使用Text-Snake管道构建自定义检测器
C)YY-Mnist简单OCR数据集
*目标:在白色背景图像中定位数字并将其分类
*应用程序:使用OCR识别的基本组件
*详细信息:超过10类的具有2K +批注的1K图像
*如何利用数据集并使用Retinanet管道构建自定义检测器
其他数据集
A)TACO垃圾检测数据集
*目标–定位和分割图像中的各种垃圾
*应用程序:试图解决公共场所垃圾问题的自动机器人的关键组件
*详细信息:包含20种以上不同类别垃圾对象的15K +注释的10K图像
*如何利用数据集并使用Retinanet管道构建自定义检测器
B)室内场景通用物体检测数据集
*目标:定位和检测图像中的室内对象
*应用程序:在带有便利设施的房地产和租赁网站中为图像自动标记
*详细信息:超过10种不同类别的室内对象(例如电器,床,窗帘,椅子等)
*如何利用数据集和使用Retinanet管道构建自定义检测器
C)EgoHands手部分割数据集
*目标:在自然场景中分割手
*应用:理解手势的第一步,以及在人机交互,手语识别中的应用
*详细信息:4.8K +图像和相应的手罩。
*如何利用数据集和使用Retinanet管道构建自定义检测器
D)UCF动作识别数据集
*目标:根据视频中执行的操作对视频进行分类
*应用:标记视频对于存储和检索大量视频很重要
*详细信息:对应于101种动作类别的1K +视频。
*如何利用数据集和使用mmaction-tsn50管道构建自定义分类器
E)油罐数据集
*目标:在卫星图像中检测油罐
*应用:跟踪油罐
*详细信息:具有10K +注释的10K +图像。
*如何利用数据集并使用Retinanet管道构建自定义分类器
其他动作识别数据集
A)楼梯动作识别数据集以及如何在其上训练模型
B)A2D动作识别数据集以及如何在其上训练模型
C)KTH动作识别数据集以及如何在其上训练模型
附录
有关教程的更多详细信息,请访问我们的Github页面
欢迎关注磐创AI博客站:
http://panchuang.net/
sklearn机器学习中文官方文档:
http://sklearn123.com/
欢迎关注磐创博客资源汇总站:
http://docs.panchuang.net/