1、MNIST是一个入门级的计算机视觉数据集,它包含各种手写数字图片
数据集被分成两部分:60000行的训练数据集(mnist.train)和10000行的测试数据集(mnist.test)。
这样的切分很重要,在机器学习模型设计时必须有一个单独的测试数据集不用于训练而是用来评估这个模型的性能,从而更加容易把设计的模型推广到其他数据集上(泛化)。
2、softmax回归(softmax regression)模型可以用来给不同的对象分配概率。
3、MNIST的数据使用
回归模型(成功率91%)
成本函数——“交叉熵”(cross-entropy)
梯度下降算法(gradient descent algorithm)以0.01的学习速率最小化交叉熵
4、运行代码,警告:Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX
如果是仅仅CPU版本,可以通过重新编译安装,提升运行效率,使用GPU版本的,可以使用以下代码忽视警告,并屏蔽警告
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
5、多层卷积网络