Newton法

崔雪婷 最优化基础理论与方法 3.2章节

1.目标

无约束优化问题
\(min\ f(x),x\in R^n\)
其中\(f(x)\)是二阶可微的

2.牛顿法的思想

\(x^*\)是局部解,则\(x^*\)满足

\[\nabla f(x)=0 \]

选取初始点\(x^1\),在\(x^1\)出按照泰勒展开,取二次近似多项式

\[f(x)\approx f(x^1)+\nabla f(x^1)^T(x-x^1)+\frac{1}{2}(x-x^1)\nabla^2f(x^1)(x-x^1) \]

令近似二次函数的导数=0,得到

\[\nabla f(x^1)+\nabla^2f(x^1)(x-x^1)=0 \]

\(\nabla^2f(x^1)\)是非奇异矩阵时,求解线上式得到
\(x^2=x^1-[\nabla^2f(x^1)]^{-1}\nabla f(x^1),\quad 这里x^2是迭代值\)
作为\(x^*\)的近似
注意,该方法只有\(f(x)\)在展开点处的Hesse矩阵\(\nabla^2 f(x^1)\)非奇异时才可以使用
即有迭代公式(牛顿公式)

\[x^{k+1}=x^k-[\nabla^2f(x^k)]^{-1}\nabla f(x^k) \]

可以改写为
\(x^{k+1}=x^k+d^k,其中d^k是线性方程组\nabla^2(x^k)d=-\nabla f(x^k)的解向量\)

3.牛顿法的步骤

  • 1.取初始点\(x^1\),置精度\(epsilon\),置k=1$
  • 2.如果\(||\nabla f(x^k)||\le \epsilon,则停止计算(x^k作为无约束问题的解);否则,求解线性方程组\)

\[\nabla^2f(x^k)d=-\nabla f(x^k) \]

得到\(d^k\)

  • 3.置

\[x^{k+1}=x^k+d^k,k:=k+1 \]

转第2步

4.优缺点

优点:当初始点\(x^0\)取得比较接近于收敛点\(x^*\),且\(\nabla^2f(x)满足较好的性质(正定),具有二阶收敛,二次终止性\)
缺点:计算量大(Hessian矩阵),适用范围较窄

posted @ 2022-03-26 10:36  筷点雪糕侠  阅读(140)  评论(0编辑  收藏  举报