BP过程的推导及链式法则中标量向量计算的过程

可以参考这篇文章:

https://zhuanlan.zhihu.com/p/36711903

《BP 神经网络 —— 逆向传播的艺术》

 

里面有一些重要的知识点:

 

神经网络的前馈 (forward propagation) 过程,前馈过程也非常容易理解,符合人正常的逻辑,具体的矩阵计算表达如下:

[公式]

[公式]

[公式]

[公式]

 

 

 

 

 

 

   这里就是sigmoid函数的求导结果

 

 

开始通过链式法则求 [公式] :

​ [公式]

继续,可求得:[公式]

[公式]

[公式]

 

根据梯度下降法,可迭代更新这两个参数值:

[公式]

[公式]

 

续逆向传播的过程,开始计算再前面一层

 

[公式]

其中,[公式], [公式]

 

注意:上面式子涉及到向量维度,可以理解为链式法则里面左侧的维度和右侧的维度是保持一致的。

可以参考这篇文章:https://www.cnblogs.com/pinard/p/10825264.html

 

 

 

 

 

 

 

求得 [公式] 之后,可方便地分别求得输入层至隐含层中 [公式] 和 [公式] 的导数:

[公式]

[公式]

同样的,根据梯度下降法对参数 [公式] 和 [公式] 进行更新:

[公式]

[公式]

 

另外注意:BP的一个很重要的优化点就是,后一层计算结果可以直接被前一层进行复用,[公式] 而不需要重复计算。 

 

posted @ 2022-02-22 15:56  blcblc  阅读(129)  评论(0编辑  收藏  举报