重要公式的推导过程
一、神经网络--反向传播详细推导过程中的公式推导
其中,aL和y为特征维度为n_out的向量,而||S||2为S的L2范数。
损失函数有了,现在我们开始用梯度下降法迭代求解每一层的W,b
首先是输出层第L层。注意到输出层的W,b满足下式:
- 求导用到的公式有:
1:标量对多个向量的链式求导法则:x→y→z其中x、y为向量,z为标量;
2:标量对矩阵求导的四个公式:这里我就写一个用到的:其中X和A是矩阵 z为标量 y为向量
- 开始求导
首先说一下其中的符号关系J(W,b,x,y)是标量,W为矩阵,a和z为向量。L代表层数
下图解释diag:
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配,妙~啊~