摘要:
1.批归一化的作用 参看权值初始化那篇的内容,批归一化的主要意图和权值初始化是一样的,是要解决梯度的前向传播和反向传播过程中,梯度弥散,梯度消失的问题 2.批归一化的流程 这里注意一点,BN层一般放在激活层前面 3.算法流程 算法比较简单,解决问题的主要宗旨和权重初始化一样,尽量能勾勒出一个0均值, 阅读全文
摘要:
原地址 https://www.bilibili.com/video/BV1ba411m72B 1.为什么需要对权重初始化精心设计 1.容易出现梯度消失(梯度特别的接近0)和梯度爆炸(梯度特别的大)的情况,导致大部分反向传播得到的梯度不起作用或者起反作用 2.设计思路 神经网络的每层的数据的传送是要 阅读全文