梯度下降
根据泰勒展开式:
于是:
于是,我们可以通过迭代 x,不断减小 f(x)
import math import matplotlib import numpy as np import gluonbook as gb from mxnet import nd,autograd,init,gluon def gd(eta): x = 10 resulte = [x] for i in range(10): x -= eta*2*x resulte.append(x) print(x) return resulte res = gd(0.2) def show_trace(res): n = max(abs(min(res)),abs(max(res)),10) f_line = np.arange(-n,n,0.1) gb.plt.plot(f_line,[x*x for x in f_line]) gb.plt.plot(res,[x*x for x in res],'-o') gb.plt.xlabel('x') gb.plt.ylabel('f(x)') show_trace(res) show_trace(gd(0.05)) show_trace(gd(1.1))
参数太小,使得到达不了最优值,参数太大,那这个泰勒展开式不成立,f(x) 可能不会减小。