摘要: 梯度下降伪代码 梯度下降可以优化损失函数的值,使其尽量小,即可找到最好(在数据集上拟合效果最好)的模型参数。 现在假设模型$f$中只有一个参数$w$,则损失函数为$L(f)=L(w)$,梯度下降算法如下(若模型有多个参数,按相同方法更新各参数) 初始化参数 随机选取一个$w0$($w0$并不一定是随 阅读全文
posted @ 2020-12-27 18:09 臭咸鱼 阅读(2875) 评论(0) 推荐(1) 编辑