重要公式的推导过程

一、神经网络--反向传播详细推导过程中的公式推导

其中,aLy为特征维度为n_out的向量,而||S||2为S的L2范数。

    损失函数有了,现在我们开始用梯度下降法迭代求解每一层的W,b

    首先是输出层第L层。注意到输出层的W,b满足下式:

  

  • 求导用到的公式有:

1:标量对多个向量的链式求导法则xyz其中x、y为向量,z为标量;

2:标量对矩阵求导的四个公式:这里我就写一个用到的:其中X和A是矩阵 z为标量 y为向量

  • 开始求导

  首先说一下其中的符号关系J(W,b,x,y)是标量,W为矩阵,a和z为向量。L代表层数

  

下图解释diag:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

posted @   小菜鸡学智能  阅读(189)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配,妙~啊~
欢迎阅读『重要公式的推导过程』
点击右上角即可分享
微信分享提示