深度学习数据集 && 第一次了解虚拟环境

MNIST：这是最大的手写数字（0～9）数据库。它由 60000 个示例的训练集和 10000 个示例的测试集组成。该数据集存放在 Yann LeCun 的主页（http://yann.lecun.com/exdb/mnist/）中。这个数据集已经包含在tensorflow.examples.tutorials.mnist 的 TensorFlow 库中。
CIFAR10：这个数据集包含了 10 个类别的 60000 幅 32×32 彩色图像，每个类别有 6000 幅图像。其中训练集包含 50000 幅图像，测试数据集包含 10000 幅图像。数据集的 10 个类别分别是：飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船和卡车。该数据由多伦多大学计算机科学系维护（https://www.cs.toronto.edu/kriz/cifar.html）。
WORDNET：这是一个英文的词汇数据库。它包含名词、动词、副词和形容词，被归为一组认知同义词（Synset），即代表相同概念的词语，例如 shut 和 close，car 和 automobile 被分组为无序集合。它包含 155287 个单词，组织在 117659 个同义词集合中，总共 206941 个单词对。该数据集由普林斯顿大学维护（https://wordnet.princeton.edu/）。
ImageNET：这是一个根据 WORDNET 层次组织的图像数据集（目前只有名词）。每个有意义的概念（synset）由多个单词或单词短语来描述。每个子空间平均由 1000 幅图像表示。目前共有 21841 个同义词，共有 14197122 幅图像。自 2010 年以来，每年举办一次 ImageNet 大规模视觉识别挑战赛（ILSVRC），将图像分类到 1000 个对象类别中。这项工作是由美国普林斯顿大学、斯坦福大学、A9 和谷歌赞助（http://www.image-net.org/）。
YouTube-8M：这是一个由数百万 YouTube 视频组成的大型标签视频数据集。它有大约 700 万个 YouTube 视频网址，分为 4716 个小类，并分为 24 个大类。它还提供预处理支持和框架功能。数据集由 Google Research（https://research.google.com/youtube8m/）维护。

TensorFlow当中读取数据的方法

　　首先学习MNIST数据集的使用。

　　这个过程真的是折磨啊，搞了一个下午。。。。还在搞

　　首先我想的是刚接触TensorFlow，那么就从可视化开始做起吧。。。先至少看看用于机器学习的图片是什么样子的。

　　首先看了这个博客https://www.cnblogs.com/xiaoyh/p/10813413.html

　　输入了里面的代码：

from tensorflow.examples.tutorials.mnist import input_data

import scipy.misc

import os

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data/",one_hot=True)

save_dir = 'MNIST_data/raw/'  #图片的保存路径
if os.path.exists(save_dir) is False:
    os.mkdir(save_dir)

for i in range(20):
  image_array = mnist.train.images[i,:]
  image_array = image_array.reshape(28,28)
  filename = save_dir+'mnist_train_%d.jpg' % i

  scipy.misc.toimage(image_array,cmin=0.0,cmax=1.0).save(filename)