为啥要使用梯度下降法

求最大值最小值的两种主流方法：

将导致设置为0当然是最简单的方法，但是有时求导之后，没法发保证左边只包含w，而右边不包含的情况，此时需要使用梯度下降法。

先随便给一个w的初始值，然后根据导函数，一步步的迭代，直到w收敛。

此时w的对应的f(w)值也越来越趋近最小值！

posted @ 2022-06-21 10:54 宋桓公阅读(57) 评论(0) 收藏举报

刷新页面返回顶部