非线性规划的最优解所满足的必要条件和充分条件(仅包含定理)
注意:文中很多地方的变量其实是矢量,比如方向 d 和梯度,为了方便写都没有写粗体。
一、无约束问题的最优性条件
二、含约束问题的最优性条件
2.1 含约束的极值问题表示
有约束的极值问题
minf(x)x∈Rn s.t. gi(x)⩾0,i=1,⋯,m,hj(x)=0,j=1,⋯,l,
其中,gi(x)⩾0 为不等式约束,hj(x)=0 为等式约束,集合
S={x∣gi(x)⩾0,i=1,⋯,m;hj(x)=0,j=1,⋯,l}
称为可行域。
2.2 可行方向与下降方向
-
下降方向
设函数 f(x) 是定义在 Rn 上的实函数,¯x∈Rn ,d 是非零向量,若存在数 δ>0 ,使得对每个 λ∈(0,δ),都有
f(¯x+λd)<f(¯x)
则称 d 是函数 f(x) 在 ¯x 处的下降方向。
如果 f(x) 是可微函数,且 ∇f(¯x)Td<0 ,则根据定理 7.1.1,d 是函数 f(x) 在 ¯x 处的下降方向,记作
F0={d∣∇f(¯¯¯x)Td<0}
-
可行方向
设集合 S⊂Rn,¯x∈clS,d 是非零向量,若存在数 δ>0 ,使得对每个 λ∈(0,δ),都有
¯x+λd∈S
则称 d 是集合 S 在 ¯x 处的可行方向。其中 "cl" 表示闭包。
集合 S 在在 ¯x 处的可行方向组成的集合
D={d∣d≠0,¯¯¯x∈clS,∃δ>0, 使得 ∀λ∈(0,δ), 有 ¯¯¯x+λd∈S}
称为在 ¯x 处的可行方向锥。
-
定理 7.2.1
设 S 是 Rn 中的非空集合,¯x∈S, f(x) 在点 ¯x 处可微,若 ¯x 是局部最优解,则 F0∩D=∅. 即若 ¯x 是局部最优解,则 ¯x 处的可行方向一定不是下降方向。
2.3 不等式约束问题
非线性规划问题
minf(x) s. t. gi(x)⩾0,i=1,⋯,m.
可行域为
S={x∣gi(x)⩾0,i=1,⋯,m}
其约束条件在点 ¯x∈S 有两种情形:
-
在点 ¯x 处起作用约束(下标集用 I 表示)
gi(¯x)=0,i∈I
-
在点 ¯x 处不起作用约束
gi(¯x)>0,i∉I.
-
用 I 表示起作用约束下标集
I={i∣gi(¯x)=0}
-
用 G0 替代定理 7.2.1 中的可行方向锥 D
G0={d∣∇gi(¯x)Td>0,i∈I}
-
定理 7.2.2(由7.2.1变化而来)—— 最优性的几何表示
设 ¯x∈S, f(x) 在点 ¯x 处可微,gi(x)(i∉I) 在 ¯x 连续,若 ¯x 是局部最优解,则
F0∩G0=∅
-
定理 7.2.3 (Fritz John条件)—— 最优性的代数表示
设 ¯x∈S,I={i|gi(¯x)=0}, f,gi∈I 在点 ¯x 处可微,gi(x)(i∉I) 在 ¯x 连续,若 ¯x 是局部最优解,则存在不全为0的非负数 w0,wi(i∈I) ,使得
w0∇f(¯x)−∑i∈Iwi∇gi(¯x)=0
证明需要用到 Gordan 定理,即 如果一组基的非负组合是一个凸锥,则等价为这组基的正组合表示不了原点,除非系数都是0(两个条件只有一个成立)
-
定理 7.2.4 (Kuhn-Tucker 条件)—— K-T条件,在Fritz John条件基础上增加了起约束作用的梯度线性无关的约束规格(对约束条件的限制),以避免出现 w0=0 的情形。
设 ¯x∈S,I={i|gi(¯x)=0}, f,gi∈I 在点 ¯x 处可微,gi(x)(i∉I) 在 ¯x 连续,{∇gi(¯x)∣i∈I} 线性无关, 若 ¯x 是局部最优解,则存在非负数 wi(i∈I) ,使得
∇f(¯x)−∑i∈Iwi∇gi(¯x)=0
若 gi(x)(i∉I) 在点 ¯x 处可微,K-T 条件可等价表示为
∇f(¯x)−m∑i=1wi∇gi(¯x)=0,wigi(¯x)=0,i=1,⋯,m,wi⩾0,i=1,⋯,m.
其中,wigi(¯x)=0 称为互补松弛条件。
-
定理 7.2.5 凸优化问题最优解的一阶充分条件
设问题中 f 是凸函数,gi(i=1,2,⋯,m) 是凹函数(注意不等式约束 gi 的符号(若是 gi≤0 ,则应该是凸函数),S 是可行域,¯x∈S,I={i|gi(¯x)=0}, f,gi∈I 在点 ¯x 处可微,gi(x)(i∉I) 在 ¯x 连续,K-T 条件成立,则 ¯x 为全局最优解。
2.4 一般约束问题
一般约束问题(含不等式和等式约束)
minf(x) s. t. gi(x)⩾0,i=1,⋯,m,hj(x)⩾0,j=1,⋯,l.
-
正则点
设 ¯x 为可行点,不等式约束中在 ¯x 起作用约束下标集记作 I ,如果向量组 {∇gi(¯x),∇hj(¯x)∣i∈I,j=1,2,⋯,l} 线性无关,就称 ¯x 为约束 g(x)≥0 和 h(x)=0 的正则点。
-
可行曲线与切平面(为描述等式约束的可行移动引入)
- 定义 7.2.4 点集 {x=x(t)∣t0⩽t⩽t1} 称为超曲面 S={x|h(x)=0} 上的一条曲线, 若对所有的 t∈[t0,t1] 均有h(x)=0 ,则如果导数 x′(t)=dx(t)dt 存在,则称曲线是可微的,该一阶导数是曲线在点 x(t) 处的切向量,曲面 S 在点 x 处所有可微切向量组成的集合,称为曲面 S 在点 x 的切平面,记作 T(x)。
-
等式约束的几何表示
设 ¯x 为曲面 S={x|h(x)=0} 上一个正则点,则在点 ¯x 切平面 T(¯x) 等于子空间 H={d∣∇h(¯x)⊤d=0}.
-
定理 7.2.7 一般约束问题最优解的一阶必要条件 —— 几何表示
设 ¯x 为可行点,I={i|gi(¯x)=0}, f,gi∈I 在点 ¯x 处可微,gi(x)(i∉I) 在 ¯x 连续,hj(j=1,2,⋯,l) 在点 ¯x 连续可微,∇hj(¯x)(j=1,2,⋯,l) 线性无关, 若 ¯x 是局部最优解,则在 ¯x 处,有
F0∩G0∩H0=∅
其中,F0,G0,H0 的定义为
F0={d∣∇f(¯x)Td<0},G0={d∣∇gi(¯x)Td>0,i∈I}H0={d∣∇hj(¯x)Td=0,j=1,2,⋯,l}.
-
定理 7.2.8 (Fritz John条件) —— 代数表示
设 ¯x 为可行点,I={i|gi(¯x)=0}, f,gi∈I 在点 ¯x 处可微,gi(x)(i∉I) 在 ¯x 连续,hj(j=1,2,⋯,l) 在点 ¯x 连续可微,若 ¯x 是局部最优解,则存在不全为零的数 w0,wi(j∈I) 和 vj(j=1,2,⋯,l) ,使得
w0∇f(¯x)−∑i∈Iwi∇gi(¯x)−i∑j=1vj∇hj(¯x)=0,w0,wi⩾0,i∈I.
-
定理 7.2.9 (Kuhn-Tucker 条件)—— K-T条件,在Fritz John条件基础上增加了起约束作用的梯度线性无关的约束规格(对约束条件的限制),以避免出现 w0=0 的情形。
设 ¯x 为可行点,I={i|gi(¯x)=0}, f,gi∈I 在点 ¯x 处可微,gi(x)(i∉I) 在 ¯x 连续,hj(j=1,2,⋯,l) 在点 ¯x 连续可微,向量集
{∇gi(¯x),∇hj(¯x)∣i∈I,j=1,⋯,l}
线性无关,若 ¯x 是局部最优解,则存在数 wi(j∈I) 和 vj(j=1,2,⋯,l) ,使得
∇f(¯x)−∑i∈Iwi∇gi(¯x)−i∑j=1vj∇hj(¯x)=0,wi⩾0,i∈I.
若 gi(x)(i∉I) 在点 ¯x 处可微,K-T 条件可等价表示为
∇f(¯x)−m∑i=1wi∇gi(¯x)−t∑j=1vj∇hj(¯x)=0wigi(¯x)=0,i=1,⋯,mwi⩾0,i=1,⋯,m,
-
广义 Lagrange 函数
L(x,w,v)=f(x)−m∑i=1wigi(x)−l∑j=1vjhj(x)
若 ¯x 是局部最优解,则存在 Lagrange 乘子 ¯w≥0 和 v ,使得
∇xL(¯x,¯w,¯v)=0
此时一般约束问题的一阶必要条件可表示为
∇xL(x,w,v)=0,gi(x)⩾0,i=1,⋯,m,hj(x)=0,j=1,⋯,l,wigi(x)=0,i=1,⋯,m,wi⩾0,i=1,⋯,m.
-
定理 7.2.10 凸优化问题最优解的充分条件
设问题中 f 是凸函数,gi(i=1,2,⋯,m) 是凹函数(注意不等式约束 gi 的符号(若是 gi≤0 ,则应该是凸函数)hj(j=1,2,⋯,l) 是线性函数,S 是可行域,¯x∈S,I={i|gi(¯x)=0},且在 ¯x 处 K-T 条件成立,即存在 wi≥0(i∈I) 及 vj(j=1,2,⋯,l) ,使得
∇f(¯x)−∑i∈Iwi∇gi(¯x)−i∑j=1vj∇hj(¯x)=0,wi⩾0,i∈I.
则 ¯x 为全局最优解。
注:此处关于函数凸性的假设还可以适当放宽,涉及到准凸和伪凸的概念。
-
切锥
设 S 是 R” 中一个非空集合, 点 ¯¯¯¯x∈clS, 集合 T={d∣ 存在 x(k)∈S,x(k)→¯x 及 λk>0, 使得 d=limk→∞λk(x(k)−¯x)}, 则称 T 为集合 S 在点 ¯x 的切锥.

-
定理 7.2.11 (二阶必要条件)
设 ¯x 是局部最优解,f,gi,hj 二次连续可微,并存在满足一阶必要条件的乘子 ¯w 和 ¯v ,再假设在点 ¯x 约束规格 ¯G=¯T 成立,则对每一个向量 d∈G,都有
dT∇2xL(¯x,¯w,¯v)d⩾0
其中,
∇2x2xL(¯x,¯w,¯v)=∇2f(¯x)−m∑i=1¯wi∇2gi(¯x)−1∑j=1¯vj∇2hj(¯x)
是 Lagrange 函数 L(x,w,v) 在 ¯x 关于 x 的 Hesse 矩阵。
集合 ¯G 为
¯G=⎧⎪
⎪
⎪
⎪⎨⎪
⎪
⎪
⎪⎩d∣∣
∣
∣
∣∣d∈Rn∇gi(¯x)Td=0,i∈I 且 ¯wi>0∇gi(¯x)Td⩾0,i∈I 且 ¯wi=0∇hj(¯x)Td=0,j=1,⋯,l⎫⎪
⎪
⎪
⎪⎬⎪
⎪
⎪
⎪⎭
-
定理 7.2.12 (二阶充分条件)
设 f,gi,hj 二次连续可微, ¯x 是可行点,并存在乘子 ¯w 和 ¯v 满足一阶必要条件,且对每一个向量 d∈G,都有
dT∇2xL(¯x,¯w,¯v)d>0
则 ¯x 是严格局部最优解。
其中,集合 G 为
¯G=⎧⎪
⎪
⎪
⎪⎨⎪
⎪
⎪
⎪⎩d∣∣
∣
∣
∣∣d≠0∇gi(¯x)Td=0,i∈I 且 ¯wi>0∇gi(¯x)Td⩾0,i∈I 且 ¯wi=0∇hj(¯x)Td=0,j=1,⋯,l⎫⎪
⎪
⎪
⎪⎬⎪
⎪
⎪
⎪⎭
- 注意:对于含等式约束优化问题的二阶极值条件,不能仅考虑 Hesse 矩阵,即便 Hesse 矩阵正定,也不一定是局部最优解。
参考链接
- 《最优化理论与算法》(第7章 最优性条件) 陈宝林著
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾(3.3-3.9)
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· AI 智能体引爆开源社区「GitHub 热点速览」