摘要: 提供的训练数据和定义的模型之间的维度不对应。 在MNIST手写数字识别时,在 中,没有加关键字参数one_hot=True 应该为: 阅读全文
posted @ 2018-01-17 15:34 Go_Forward 阅读(766) 评论(0) 推荐(0) 编辑
摘要: tf.nn.sparse_softmax_cross_entropy_with_logits() 当正确结果只有一个时,可以加速计算,比如MNIST数字识别,每张图片中仅包含一个数字,所以可以使用这个函数加速计算,并且在使用时前向传播的计算结果不需要计算softmax。 cross_entropy 阅读全文
posted @ 2018-01-17 10:59 Go_Forward 阅读(258) 评论(0) 推荐(0) 编辑
摘要: tensorflow使用tf.train.ExponentialMovingAverage实现滑动平均模型,在使用随机梯度下降方法训练神经网络时候,使用这个模型可以增强模型的鲁棒性(robust),可以在一定程度上提高模型在测试数据集上的表现。 滑动平均模型为每个变量维护一个影子变量,其初始值是变量 阅读全文
posted @ 2018-01-17 10:04 Go_Forward 阅读(2036) 评论(0) 推荐(0) 编辑