BP过程的推导及链式法则中标量向量计算的过程

可以参考这篇文章:

https://zhuanlan.zhihu.com/p/36711903

《BP 神经网络 —— 逆向传播的艺术》

 

里面有一些重要的知识点:

 

神经网络的前馈 (forward propagation) 过程,前馈过程也非常容易理解,符合人正常的逻辑,具体的矩阵计算表达如下:

[公式]

[公式]

[公式]

[公式]

 

 

 

 

 

 

   这里就是sigmoid函数的求导结果

 

 

开始通过链式法则求 [公式] :

​ [公式]

继续,可求得:[公式]

[公式]

[公式]

 

根据梯度下降法,可迭代更新这两个参数值:

[公式]

[公式]

 

续逆向传播的过程,开始计算再前面一层

 

[公式]

其中,[公式], [公式]

 

注意:上面式子涉及到向量维度,可以理解为链式法则里面左侧的维度和右侧的维度是保持一致的。

可以参考这篇文章:https://www.cnblogs.com/pinard/p/10825264.html

 

 

 

 

 

 

 

求得 [公式] 之后,可方便地分别求得输入层至隐含层中 [公式] 和 [公式] 的导数:

[公式]

[公式]

同样的,根据梯度下降法对参数 [公式] 和 [公式] 进行更新:

[公式]

[公式]

 

另外注意:BP的一个很重要的优化点就是,后一层计算结果可以直接被前一层进行复用,[公式] 而不需要重复计算。 

 

posted @   blcblc  阅读(141)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
历史上的今天:
2019-02-22 识别疑问句的训练
2019-02-22 准备参考这个做个tf-serving
2018-02-22 推荐-离线评估指标-设计 - F-Score, AUC,NDCG,MAP等等 - 目标不可微很难优化 - NDCG连续MAP离散 - 弱泛化和强泛化 - 冷启动 - 训练测试集拆分的好办法
2018-02-22 矩阵相乘 与 行列变换
2018-02-22 SVM和SVC的学习
2018-02-22 标准化- 正则化 等数据处理 sklearn来支持
2018-02-22 从mofa上面学习sklearn - 通用流程,标准化,learning_curve,validation_curve
点击右上角即可分享
微信分享提示