MNIST机器学习
MNIST是一个入门级的计算机视觉数据集,MINIST数据集包含两部分:60000行训练数据集和10000行测试数据集;每一个MNIST数据单元包含一张手写数字图片和每一张图片对应的标签;我们把这些图片设为“xs",标签设为”ys“,训练数据集和测试数据集都包含xs和ys;
在MNIST训练数据集中,图片集是一个形状为[60000,784]的张量,第一个维度数字用来索引图片,第二个维度数字用来索引每张图片中的像素点,在此张量里的每一个元素,都表示某张图片里的某个像素的强度值,值介于0和1之间;标签集是一个[60000,10]的数字矩阵;
Softmax Regression:简单的数学模型;softmax模型可以用来给不同的对象分配概率
Softmax回归: 分两步:第一步:为了得到一张给定图片属于某个特定数字类的证据,我们对图片像素进行加权求和(像素有很强的证据不属于该类,相应权值为负数,像素有很强的证据属于该类,相应权值为正数);第二步:用softmax函数可以把这些证据转换为概率y;
训练模型:需要定义一个指标来评估这个模型是好的;在机器学习中,通常定义指标来表示一个模型是坏的,这个指标称为成本或损失,然后尽量最小化这个指标(这两种方式是相同的)
交叉熵:一个非常常见的,非常漂亮的成本函数;交叉熵产生于信息论里面的信息压缩编码技术,后来演变成从博弈论到机器学习等其他领域里的重要技术手段;比较粗糙的理解是,交叉熵是用来衡量我们的预测用于描述真相的低效性;