摘要: 批量归一化(BN)如何实现?作用 实现过程: 计算训练阶段mini_batch数量激活函数前结果的均值和方差,然后对其进行归一化,最后对其进行放缩和平移。 作用: 可以使用更高的学习率进行优化 移除或使用较低的dropout 降低L2权重衰减系数 调整数据的分布,不考虑激活函数,它让没一层的输出归一 阅读全文
posted @ 2023-03-04 20:47 牛犁heart 阅读(50) 评论(0) 推荐(0) 编辑