最优性条件

非线性规划的最优解所满足的必要条件和充分条件(仅包含定理)

注意:文中很多地方的变量其实是矢量,比如方向 d 和梯度,为了方便写都没有写粗体。

一、无约束问题的最优性条件

  • 定理 7.1.1 (其它定理证明需要的基础定理)

    设函数 f(x) 在点 x¯ 处可微,如果存在方向 d ,使得 f(x¯)Td<0 ,则存在 δ>0 ,使得对每个 λ(0,δ),有 f(x¯+λd)<f(x¯).

  • 定理 7.1.2 (局部极小点的一阶必要条件)

    设函数 f(x) 在点 x¯ 处二次可微,若点 x¯ 是局部极小点,则梯度 f(x¯)=0.

  • 定理 7.1.3 (局部极小点的二阶必要条件)

    设函数 f(x) 在点 x¯ 处二次可微,若点 x¯ 是局部极小点,则梯度 f(x¯)=0,且 Hesse 矩阵 2f(x¯) 半正定.

  • 定理 7.1.4 局部极小点的二阶充分条件

    设函数 f(x) 在点 x¯ 处二次可微,若梯度 f(x¯)=0,且 Hesse 矩阵 2f(x¯) 正定,则 x¯ 是局部极小点.

  • 定理 7.1.5 (函数凸性假设下,全局极小点的充要条件)

    设函数 f(x) 是定义在 Rn 上的可微凸函数x¯Rn ,则 x¯ 是全局极小点的充分必要条件是梯度 f(x¯)=0.

二、含约束问题的最优性条件

2.1 含约束的极值问题表示

有约束的极值问题

minf(x)xRn s.t. gi(x)0,i=1,,m,hj(x)=0,j=1,,l,

其中,gi(x)0不等式约束hj(x)=0等式约束,集合

S={xgi(x)0,i=1,,m;hj(x)=0,j=1,,l}

称为可行域

2.2 可行方向与下降方向

  • 下降方向

    设函数 f(x) 是定义在 Rn 上的实函数,x¯Rnd 是非零向量,若存在数 δ>0 ,使得对每个 λ(0,δ)​,都有

    f(x¯+λd)<f(x¯)

    则称 d 是函数 f(x)x¯ 处的下降方向。

    如果 f(x) 是可微函数,且 f(x¯)Td<0 ,则根据定理 7.1.1,d 是函数 f(x)x¯ 处的下降方向,记作

    F0={df(x¯)Td<0}

  • 可行方向

    设集合 SRn,x¯clSd 是非零向量,若存在数 δ>0 ,使得对每个 λ(0,δ),都有

    x¯+λdS

    则称 d 是集合 Sx¯ 处的可行方向。其中 "cl" 表示闭包。

    集合 S 在在 x¯ 处的可行方向组成的集合

    D={dd0,x¯clS,δ>0, 使得 λ(0,δ), 有 x¯+λdS}

    称为在 x¯ 处的可行方向锥

  • 定理 7.2.1

    SRn 中的非空集合,x¯Sf(x) 在点 x¯ 处可微,若 x¯ 是局部最优解,则 F0D=. 即若 x¯ 是局部最优解,则 x¯ 处的可行方向一定不是下降方向。

2.3 不等式约束问题

非线性规划问题

minf(x) s. t. gi(x)0,i=1,,m.

可行域为

S={xgi(x)0,i=1,,m}

其约束条件在点 x¯S 有两种情形:

  • 在点 x¯ 处起作用约束(下标集用 I 表示)

    gi(x¯)=0,iI

  • 在点 x¯ 处不起作用约束

    gi(x¯)>0,iI.

    • I 表示起作用约束下标集

      I={igi(x¯)=0}

    • G0 替代定理 7.2.1 中的可行方向锥 D

      G0={dgi(x¯)Td>0,iI}

  • 定理 7.2.2(由7.2.1变化而来)—— 最优性的几何表示

    x¯Sf(x) 在点 x¯ 处可微,gi(x)(iI)x¯ 连续,若 x¯ 是局部最优解,则

    F0G0=

  • 定理 7.2.3 (Fritz John条件)—— 最优性的代数表示

    x¯SI={i|gi(x¯)=0}f,giI 在点 x¯ 处可微,gi(x)(iI)x¯ 连续,若 x¯ 是局部最优解,则存在不全为0的非负数 w0,wi(iI) ,使得

    w0f(x¯)iIwigi(x¯)=0

    证明需要用到 Gordan 定理,即 如果一组基的非负组合是一个凸锥,则等价为这组基的正组合表示不了原点,除非系数都是0(两个条件只有一个成立)

  • 定理 7.2.4 (Kuhn-Tucker 条件)—— K-T条件,在Fritz John条件基础上增加了起约束作用的梯度线性无关的约束规格(对约束条件的限制),以避免出现 w0=0 的情形。

    x¯S​,I={i|gi(x¯)=0}​, f,giI​ 在点 x¯​ 处可微,gi(x)(iI)​ 在 x¯​ 连续,{gi(x¯)iI}线性无关, 若 x¯​ 是局部最优解,则存在非负数 wi(iI)​ ,使得

    f(x¯)iIwigi(x¯)=0

    gi(x)(iI) 在点 x¯ 处可微,K-T 条件可等价表示为

    f(x¯)i=1mwigi(x¯)=0,wigi(x¯)=0,i=1,,m,wi0,i=1,,m.

    其中,wigi(x¯)=0 称为互补松弛条件

  • 定理 7.2.5 凸优化问题最优解的一阶充分条件

    设问题中 f 是凸函数,gi(i=1,2,,m) 是凹函数(注意不等式约束 gi 的符号(若是 gi0 ,则应该是凸函数),S 是可行域,x¯SI={i|gi(x¯)=0}f,giI 在点 x¯ 处可微,gi(x)(iI)x¯ 连续,K-T 条件成立,则 x¯ 为全局最优解。

2.4 一般约束问题

一般约束问题(含不等式和等式约束)

minf(x) s. t. gi(x)0,i=1,,m,hj(x)0,j=1,,l.

  • 正则点

    x¯ 为可行点,不等式约束中在 x¯ 起作用约束下标集记作 I ,如果向量组 {gi(x¯),hj(x¯)iI,j=1,2,,l} 线性无关,就称 x¯ 为约束 g(x)0h(x)=0 的正则点。

  • 可行曲线与切平面(为描述等式约束的可行移动引入)

    • 定义 7.2.4 点集 {x=x(t)t0tt1} 称为超曲面 S={x|h(x)=0} 上的一条曲线, 若对所有的 t[t0,t1] 均有h(x)=0 ,则如果导数 x(t)=dx(t)dt 存在,则称曲线是可微的,该一阶导数是曲线在点 x(t) 处的切向量,曲面 S 在点 x 处所有可微切向量组成的集合,称为曲面 S 在点 x 的切平面,记作 T(x)
  • 等式约束的几何表示

    x¯ 为曲面 S={x|h(x)=0} 上一个正则点,则在点 x¯ 切平面 T(x¯) 等于子空间 H={dh(x¯)d=0}.

  • 定理 7.2.7 一般约束问题最优解的一阶必要条件 —— 几何表示

    x¯ 为可行点,I={i|gi(x¯)=0}f,giI 在点 x¯ 处可微,gi(x)(iI)x¯ 连续,hj(j=1,2,,l) 在点 x¯ 连续可微,hj(x¯)(j=1,2,,l) 线性无关, 若 x¯ 是局部最优解,则在 x¯ 处,有

    F0G0H0=

    其中,F0,G0,H0 的定义为

    F0={df(x¯)Td<0},G0={dgi(x¯)Td>0,iI}H0={dhj(x¯)Td=0,j=1,2,,l}.

  • 定理 7.2.8 (Fritz John条件) —— 代数表示

    x¯ 为可行点,I={i|gi(x¯)=0}f,giI 在点 x¯ 处可微,gi(x)(iI)x¯ 连续,hj(j=1,2,,l) 在点 x¯ 连续可微,若 x¯ 是局部最优解,则存在不全为零的数 w0,wi(jI)vj(j=1,2,,l) ,使得

    w0f(x¯)iIwigi(x¯)j=1ivjhj(x¯)=0,w0,wi0,iI.

  • 定理 7.2.9 (Kuhn-Tucker 条件)—— K-T条件,在Fritz John条件基础上增加了起约束作用的梯度线性无关的约束规格(对约束条件的限制),以避免出现 w0=0 的情形。

    x¯ 为可行点,I={i|gi(x¯)=0}f,giI 在点 x¯ 处可微,gi(x)(iI)x¯ 连续,hj(j=1,2,,l) 在点 x¯ 连续可微,向量集

    {gi(x¯),hj(x¯)iI,j=1,,l}

    线性无关,若 x¯​ 是局部最优解,则存在数 wi(jI)​ 和 vj(j=1,2,,l)​ ,使得

    f(x¯)iIwigi(x¯)j=1ivjhj(x¯)=0,wi0,iI.

    gi(x)(iI) 在点 x¯ 处可微,K-T 条件可等价表示为

    f(x¯)i=1mwigi(x¯)j=1tvjhj(x¯)=0wigi(x¯)=0,i=1,,mwi0,i=1,,m,

  • 广义 Lagrange 函数

    L(x,w,v)=f(x)i=1mwigi(x)j=1lvjhj(x)

    x¯ 是局部最优解,则存在 Lagrange 乘子 w¯0v ,使得

    xL(x¯,w¯,v¯)=0

    此时一般约束问题的一阶必要条件可表示为

    xL(x,w,v)=0,gi(x)0,i=1,,m,hj(x)=0,j=1,,l,wigi(x)=0,i=1,,m,wi0,i=1,,m.

  • 定理 7.2.10 凸优化问题最优解的充分条件

    设问题中 f 是凸函数,gi(i=1,2,,m) 是凹函数(注意不等式约束 gi 的符号(若是 gi0 ,则应该是凸函数)hj(j=1,2,,l) 是线性函数,S 是可行域,x¯SI={i|gi(x¯)=0},且在 x¯ 处 K-T 条件成立,即存在 wi0(iI)vj(j=1,2,,l) ,使得

    f(x¯)iIwigi(x¯)j=1ivjhj(x¯)=0,wi0,iI.

    x¯ 为全局最优解。

    注:此处关于函数凸性的假设还可以适当放宽,涉及到准凸和伪凸的概念。

  • 切锥

    SR 中一个非空集合, 点 x¯clS, 集合 T={d 存在 x(k)S,x(k)x¯λk>0, 使得 d=limkλk(x(k)x¯)}, 则称 T 为集合 S 在点 x¯ 的切锥.

  • 定理 7.2.11 (二阶必要条件)

    x¯ 是局部最优解,f,gi,hj 二次连续可微,并存在满足一阶必要条件的乘子 w¯v¯ ,再假设在点 x¯ 约束规格 G¯=T¯ 成立,则对每一个向量 dG,都有

    dTx2L(x¯,w¯,v¯)d0

    其中,

    xx22L(x¯,w¯,v¯)=2f(x¯)i=1mw¯i2gi(x¯)j=11v¯j2hj(x¯)

    是 Lagrange 函数 L(x,w,v)x¯ 关于 x 的 Hesse 矩阵。

    集合 G¯

    G¯={d|dRngi(x¯)Td=0,iI 且 w¯i>0gi(x¯)Td0,iI 且 w¯i=0hj(x¯)Td=0,j=1,,l}

  • 定理 7.2.12 (二阶充分条件)

    f,gi,hj 二次连续可微, x¯ 是可行点,并存在乘子 w¯v¯ 满足一阶必要条件,且对每一个向量 dG​,都有

    dTx2L(x¯,w¯,v¯)d>0

    x¯ 是严格局部最优解。

    其中,集合 G

    G¯={d|d0gi(x¯)Td=0,iI 且 w¯i>0gi(x¯)Td0,iI 且 w¯i=0hj(x¯)Td=0,j=1,,l}

    • 注意:对于含等式约束优化问题的二阶极值条件,不能仅考虑 Hesse 矩阵,即便 Hesse 矩阵正定,也不一定是局部最优解。

参考链接

  • 《最优化理论与算法》(第7章 最优性条件) 陈宝林著
posted @   无发可理的理发师  阅读(375)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾(3.3-3.9)
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· AI 智能体引爆开源社区「GitHub 热点速览」
点击右上角即可分享
微信分享提示