智健blog

摘要: Batch Normalization 为了解决深度网络训练时可能会出现的梯度消失、梯度爆炸或者,导致收敛速度变慢的 问题,使用批标准化的方法将每层的数据都规范到相同的均值和方差, 批标准化可以解决 internal convraiate shift,通过适当的使用较大的学习率,减少训练时间; 能够 阅读全文
posted @ 2022-06-02 21:46 智健 阅读(24) 评论(0) 推荐(0) 编辑