反向传播详解
-
反向传播
- 下降的幅度与斜率大小成正比,越到最小点时,每步应越来越小,防止调过头
- 某一点导数大小即可表现为 w的变化幅度 w - k * ▽J(w)
- ▽J(w)为正表示向左走 w变小 ,为负表示向右走 w会变大
-
简单数字识别案例中
-
对于一张图片,输入图片特征,经过隐藏层, 转化为10维向量,经过sigmod ,rule后----->(对应的概率值)
-
此时假设为bad network
0.1 1--------------------------1
0.2 2--------------------------2 假设为真实值
0.8 3--------------------------3
-
此时需要做的就是提高0.2的值,减少其他 (但应该注意,增加2的激活值,比减少1的激活值重要)
-
变动的大小与 目标值与现在值之间的差成正比
-
0.2(激活值) = w0*a1+w0*a2+.......+b 增加激活值
- 增加b
- 改变权重
- 并不是要增加所有的w,
- 每个w对应的a较大时,此时w对激活值的影响较大,把影响大的成为正,小的成为负
- 对于0.1 0.8 的变化 也会的到正负变化 综合之后,即可得到上层激活值的变化趋势,
- 再次循环,计算上一层
- 改变上一层激活值a
-
迭代一步,对每一个样本计算,求出权重变化值, 求平均 ,修改权重 再次迭代 ,速度较慢
-
因此划分为小批量,此时迭代一步的数量就是batch的数量 不断循环
-
参考:
https://www.bilibili.com/video/av16144388?from=search&seid=41428351275121069
https://www.bilibili.com/video/av16577449?p=1
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文链接,如有问题, 可评论咨询.