摘要: 之前所讲解的梯度下降法是批量梯度下降法(Batch Gradient Descent),我们将要优化的损失函数在某一点$\theta$的梯度值准确的求出来 $$\Lambda J = \begin{bmatrix} \frac{\partial J}{\partial \theta _0} \\ \ 阅读全文
posted @ 2019-07-19 19:59 凌晨四点的洛杉矶 阅读(311) 评论(0) 推荐(0) 编辑