摘要: 我们已经知道梯度下降的每一次迭代可以看作求\(\hat f(x)=f(x_k)+\lang \nabla f(x_k),x-x_k\rang+\dfrac{1}{2\eta}\|x-x_k\|^2\)的最小值,而\(\hat f(x)\)的选取其实并不是唯一的,换言之我们不一定要选取二次函数。二次函 阅读全文
posted @ 2024-01-03 14:19 DennyQi 阅读(200) 评论(1) 推荐(0) 编辑