计算机视觉标准数据集整理

VOC2007 与 VOC2012

此数据集可以用于图像分类,目标检测,图像分割!!!

数据集下载镜像网站: http://pjreddie.com/projects/pascal-voc-dataset-mirror/

VOC2012: Train/Validation Data(1.9GB),Test Data(1.8GB),主页: http://host.robots.ox.ac.uk:8080/pascal/VOC/voc2012/

VOC2007: Train/Validation Data(439MB),Test Data(431MB),主页: http://host.robots.ox.ac.uk:8080/pascal/VOC/voc2007/

MNIST手写体数据集(用作10类图像分类)

包含了60,000张28x28的二值(手写数字的)训练图像,10,000张28x28的二值(手写数字的)测试图像.用作分类任务,可以分成0-9这10个类别!

引用:Y. LeCun, L. Bottou, Y. Bengio, and P. Haffner. "Gradient-based learning applied to document recognition." Proceedings of the IEEE, 86(11):2278-2324, November 1998.

CIFAR-10(用作10类图像分类)

此数据集包含了60,000张32x32的RGB图像,总共有10类图像,大约6000张图像/类,50,000张做训练,10,000张做测试!

此数据集有三个版本的数据可供下载: Python版本(163MB), MATLAB版本(175MB), 二值版本(162MB)!

CIFAR-100(用作100类图像分类)

这个数据集和CIFAR-10相比,它具有100个类,大约600张/类,每类500张训练,500张测试.这100类又可以grouped成20个大类.

此数据集也有三个版本的数据可供下载: Python版本(161MB), MATLAB版本(175MB), 二值版本(161MB)!

引用: Learning Multiple Layers of Features from Tiny Images, Alex Krizhevsky, 2009

CIFAR-10和CIFAR-100都是80 million tiny images dataset的子集!

80 million tiny images dataset

这个数据集包含了79,302,017张32x32的RGB图像,下载时包含了5个文件,网站上也提供了示例代码教你如何加载这些数据!

1. Image binary (227GB)

2. Metadata binary (57GB)

3. Gist binary (114GB)

4. Index data (7MB)

5. Matlab Tiny Images toolbox (150kB)

Caltech_101(用作101类图像分类)

这个数据集包含了101类的图像,每类大约有40~800张图像,大部分是50张/类,在2003年由lifeifei收集,每张图像的大小大约是300x200.

数据集下载: 101_ObjectCategories.tar.gz(131MB)

Caltech_256(用作256类图像分类)

此数据集和Caltech_101相似,包含了30,607张图像,数据集下载: 256_ObjectCategroies.tar(1.2GB)

Imagenet

IMAGENET Large Scale Visual Recognition Challenge(ILSVRC)

从2010年开始,每年举办的ILSVRC图像分类和目标检测大赛,数据集下载: http://image-net.org/download-images

 

posted @ 2016-12-07 10:50  Zhao-Pace  阅读(17580)  评论(0编辑  收藏  举报