摘要: 一、数据集与模型的介绍 数据集的来源是Fashion MNIST数据集,Fashion MNIST是衣物图数据,该数据集包含 10 个类别的 70,000 个灰度图像。我们用这个数据构建一个神经网络模型,并训练它,模型的结构为input=784,layer1=128,output=10。 数据集的图 阅读全文
posted @ 2020-11-18 18:18 我不是高斯分布 阅读(2199) 评论(0) 推荐(1) 编辑
摘要: 一、指数衰减学习率 为什么使用指数衰减学习率,在进行模型训练时,学习率如果固定不变,可能在接近最小值时,由于学习率过大一直在最小值范围震荡,若学习率逐步减小,开始时可以设置较大学习率,可以先快速拟合最优解,最后使参数的拟合区域稳定。 二、激活函数 1、sigmod激活函数 tf.nn.sigmoid 阅读全文
posted @ 2020-11-18 15:18 我不是高斯分布 阅读(662) 评论(0) 推荐(0) 编辑