反向求导

在上一节中，我们大致对神经网络的梯度更新有了了解，其中最核心的部分就是求出损失函数对权重

其中，

𝑦 𝑜 𝑢 𝑡 \sim (𝑤 3 11 𝑤 2 11 + 𝑤 3 21 𝑤 2 12) 𝑤 1 11 𝑥 1,

用矩阵表示为：

\partial 𝐿 \partial 𝑊 1 = ⎡⎣⎢⎢⎢⎢⎢⎢⎢ \partial 𝑦 𝑜 𝑢 𝑡 \partial 𝑤 1 11

因此，整个反向传播的过程如下：

首先计算：

然后计算：

最后计算：

为了方便计算，反向传播通过使用计算图的形式在 Tensorflow，PyTorch 等深度学习框架中实现，将上述过程绘制成计算图如下：

根据计算图，可以轻而易举地计算出损失函数对每个变量的导数。

posted @ 2021-08-30 19:46 薛定谔的小冰阅读(688) 评论(0) 收藏举报

刷新页面返回顶部

薛定谔的小冰