摘要: 一、BN 的作用 1、具有快速训练收敛的特性:采用初始很大的学习率,然后学习率的衰减速度也很大 2、具有提高网络泛化能力的特性:不用去理会过拟合中drop out、L2正则项参数的选择问题 3、不需要使用使用局部响应归一化层,BN本身就是一个归一化网络层 4、可以把训练数据彻底打乱 神经网络训练开始 阅读全文
posted @ 2017-12-13 10:42 圆圆后脑勺 阅读(3128) 评论(0) 推荐(0) 编辑