凸集和凸函数
定义与基本性质
- 若E⊆Rm满足,∀x,y∈E,∀t∈[0,1],有(1−t)x+ty∈E,则称E是Rm上的凸集.
- 若E是Rm上的凸集,称f:E↦R是凸(凹)函数如果f((1−t)x+ty)≤(≥)(1−t)f(x)+tf(y),∀x,y∈E,∀t∈[0,1].
- E是Rm上凸集,则f是凸函数⇔{(x,y)|y≥f(x),x∈E}是Rm+1上的凸集.
- 由凸函数的定义,∀{tk}nk=1满足tk≥0,∑nk=1tk=1,则∑nk=1tkxk∈E且f(∑nk=1tkxk)≤∑nk=1tkf(xk)
- 若E是凸集,¯¯¯¯E也是凸集
- 若→a1,→a2…→an∈Rm,称∑ni=1ti→ai,∀1≤i≤n,ti≥0,∑ni=1ti=1为→a1,→a2…→an的一个凸组合,由此可以引出凸包(Convex Hull)的概念.
- 若E⊆Rm,称Conv(E)为E的凸包Conv(E):=n∑i=1tixi|∀1≤i≤n,xi∈E,n∑i=1ti=1,n∈N.不难验证,Conv(E)是包含E的最小凸集.
若→a1,→a2…→an∈Rm,则Conv({→a1,→a2…→an})是紧凸集.
事实上,T={→t=(t1,t2…tm)|∑mi=1ti=1}是紧凸集.同时定义Φ(→t)=∑mi=1ti→ai,则Φ:T↦Conv({→a1,→a2…→an})是连续的一一映射.
- 若E是凸集,称x∈E是E的极点当且仅当x不能表示为E中其他点的凸组合.即∀t∈]0,1[,∀a,b∈E,x≠ta+(1−t)b.
由定义可知,若x∈˚E,x不可能是E的极点.因此,极点只能在∂E上.
- 若K⊆Rm是紧凸集,则K一定有极点,若K不是单点集,K至少有两个极点.
- 若K的全部极点是→a1,→a2…→an,则K=Conv({→a1,→a2…→an}).
- ∏mi=1[ai,bi]的全体极点是全体顶点.
凸函数的上确界
交点引理
设E⊆Rm是紧集,x∈K,y∈Rm,x≠y,则从y出发经过x的射线必与∂K有不同于y的交点.即ρ:=max{t≥1|y+t(x−y)∈K}是良定义的且y+ρ(x−y)∈∂K.特别地,如果x∈˚K,则ρ≥r1+2|x−y|>1,其中r满足B(x,r)⊆K.
◀ 定义I={t≥1|y+t(x−y)∈K}同时不难发现(t−1)|x−y|=|y+t(x−y)−x|≤diam(K)⇒t≤1+diam(K)|x−y|I有上界⇒I有上确界,又K是闭集⇒maxI存在显然如果y+ρ(x−y)∈˚K,ρ可以更大由此也可以发现当x∈˚K时,ρ>1. ▶
极值问题
K⊆Rm是紧凸集,f:K↦R是凸函数.则:
- supx∈Kf(x)=supx∈∂Kf(x).
- 特别地,若f在K上连续,则有maxx∈Kf(x)=maxx∈∂Kf(x).即最值可以在边界上达到.
- 若∃x0∈˚K,f(x0)=maxx∈Kf(x).则f(x)≡c.
对于凹函数,将上面的sup换成inf,max换成min.
◀ 主要思路:∀x∈˚K,y∈∂K,∃z∈∂K,y≠z,f(x)的值可以由f(y)与f(z)控制具体地,记z=ρ(x−y)+y,ρ>1⇒f(x)≤ρ−1ρf(y)+1ρz⇒f(x)≤supx∈∂Kf(x)由紧集和f的连续性,容易推出第二三条. ▶
紧集条件不能去除,一个反例是K={(x1,x2…xm)∈Rm|xi≥0,∀1≤i≤m,∑mi=1xi<1},f(x)=11−∑mi=1xi.
紧凸多面体的极值
若K=conv(→a1,→a2…→an)⊆Rm,f:K↦R是凸函数,则f在K上有界.即max1≤i≤nf(→ai)+nmin1≤i≤n[f(→c)−f(→ai)]≤f(x)≤max1≤i≤nf(→ai).其中c=1n∑ni=1→ai.特别地,maxx∈Kf(x)=max1≤i≤nf(→ai).
凸函数的下界
设f:E↦R为凸函数,E是有界凸集且˚E≠∅,则infx∈Ef(x)>−∞.
◀ 取→c=(c1,c2…cm)∈˚E⇒∃δ>0,K:=∏mi=1[ci−δ,ci+δ]⊆EK是凸多面体⇒∃M>0,∀y∈K,−M≤f(y)≤M取x∈E,x∉K,∃ρ>1,ρ(→c−x)+x∈∂K,记z=ρ(→c−x)+x.⇒f(→c)≤ρ−1ρf(x)+1ρf(z)⇒f(x)≥−ρ+1ρ−1M.而ρ−1有上界因为→c=ρ−1ρx+1ρz⇒ρ−1ρ|x−z|=1ρ|→c−z|⇒ρ−1=|→c−z|x−z≥δ2diam(E)⇒f(x)有界. ▶
以上˚E≠∅的条件可以去除.
考虑˚E=∅的情形:
- E为单点集,命题成立.
- E不是单点集,∃x∈E及1≤k<m维线性空间W,E⊆x+W且E−x对于W而言内部不为空.
◀ 令k=max{p|∃x0,x1…xp∈E使得x1−x0,x2−x0…xp−x0线性无关}显然k≤m,而如果k=m,即∃x0,x1…xm∈E使得x1−x0,x2−x0…xm−x0线性无关.考虑集合S=x0+Conv({x1−x0,x2−x0…xm−x0}).将x1−x0,x2−x0…xm−x0作为Rm的一组基.有坐标映射ϕ:Rm↦Rm.∀x∈Rm,x=c1(x1−x0)+c2(x2−x0)⋯+cm(xm−x0),ϕ(x)=(c1,c2…cm).不难发现S有内点等价于ϕ(S)有内点⇒˚S≠∅,矛盾⇒k<m.现在有x0,x1…xp∈E使得x1−x0,x2−x0…xp−x0线性无关.由k的定义,∀x∈E,x∈Span(x1−x0,x2−x0…xp−x0).由上面的证明不难看出E−x0对于W而言内部不为空.同时,定义^E={ϕ(x)|x∈E},g(ϕ(x))=f(x)⇒g是定义在^E上的凸函数⇒g有下界⇒f有下界. ▶
凸函数在局部是Lipschitz函数
若f:E↦Rm是凸函数,对x0∈E,定义I(x0,δ)=∏mi=1[x+i−δ,xi+δ].
-
若I(x0,2δ)⊆E,则f在I(x0,δ)上有界且满足Lipschitz条件.
考虑I(x0,δ)中两点x,y和I(x0,2δ)中一点z满足x+δ(x−y)√M|x−y|,其中M=supx∈E|f(x)|,f(x)−f(y)由f(y)−f(z)控制,通过使得其只与|x−y|相关,再由xy的对称性确定|f(x)−f(y)|满足Lipschitz条件.
-
若E是开集,K⊂E是紧集,则f在K上满足Lipschitz条件.
结合上一条,对x∈K,∃δx>0,I(x,δx)⊆E,取所有˚I(x,δx)得到K的有限开覆盖.
-
f在˚E上连续.
凸投影定理和凸函数的支撑平面
凸投影定理
设K⊆Rm为非空的闭凸集,则有:
-
∀x∈Rm,∃x∗∈K,dist(x,K)=dist(x−x∗),且∀y∈K,(x−x∗,y−x∗)≤0,即x−x∗与y−x∗的夹角大于π2.
-
引入垂足映射P:Rm↦K,P(x)=x∗,∀x∈Rm.则有∀x,y∈Rm,|P(x)−P(y)|≤|x−y|.
不妨先假定x∉K,则有dist(x,x∗)≠0.
先证明P是良定义的,假设∃x∈Rm,x∗1,x∗2∈K满足dist(x,K)=dist(x,x∗1)=dist(x,x∗2).
取z=12(x∗1+x∗2)∈K,有|x−z|≤|x−x∗1|⇒|x−z|=|x−x∗1|.
由平行四边形法则,2(|x−x∗1|2+|x−x∗2|2)=|x∗1−x∗2|2+4|x−z|2.
⇒|x∗1−x∗2|2=0⇒x∗1=x∗2.
固定x∈Rm,y∈K,定义f:[0,1]↦R,f(t)=|x−x∗−t(y−x∗)|2,∀t∈[0,1].
∀t∈]0,1],x∗+t(y−x∗)∈K,由x∗的唯一性,可知f(t)>f(0).
⇒f′+(0)≥0⇒−2t(x−x∗,y−x∗)≥0⇒(x−x∗,y−x∗)≤0.
∀x,y∈Rm,|P(x)−P(y)|2=(P(x)−P(y),P(x)−P(y))=(P(x)−x,P(x)−P(y))+(x−y,P(x)−P(y))+(y−P(y),P(x)−P(y))且有(P(x)−x,P(x)−P(y))≤0,(y−P(y),P(x)−P(y))≤0.
⇒|P(x)−P(y)|2≤(x−y,P(x)−P(y)).
⇒|P(x)−P(y)|≤|x−y|.
-
设E⊆Rm是闭凸集,f∈C(E;Rn),记F=f∘P则有F|E=f,F∈C(rm;Rn).
-
分离性
设K⊆Rm是闭凸集,x∉K,则∃s∈Rm,s≠0,(s,x)>supy∈K(s,y).即在s的方向上,x在K的上方.
令s=x−P(x)⇒∀y∈K,(s,y−P(x))≤0⇒(s,y−x+s)≤0⇒(s,x)≥|s|2+(s,y).
-
分离性的推论
若K是凸集,x∈∂K,则∃s∈Rm,s≠0满足(s,x)≥(s,y),∀y∈K.
∂K=∂¯¯¯¯¯K⇒∃{xn}⊆¯¯¯¯¯Kc,xn→x.
由分离性,∃sn≠0,|sn|=1满足(sn,xn)≥(s,y),∀y∈K.
{sn}有收敛到s的收敛子列⇒(s,x)≥(s,y),∀y∈K.
凸函数的支撑平面
若f:E⊆Rm↦R,f是凸函数,则∀x∈˚E,∃v(x)∈Rm满足∀y∈E,f(y)≥f(x)+v(x)⋅(y−x).其中v(x)称为x的支撑平面.
特别地,m=1时,v(x)介于f′−(x)与f′+(x)之间.v(x)唯一⇔f是可微的.
记K={(x,z)|z≥f(x)}是Rm+1上的凸集⇒(x,f(x))∈∂K.由分离性的推论,∃(s,α)∈Rm+1,(s,α)≠0且(s,x)+αf(x)≥(s,y)+αr,∀(y,r)∈K.
若α>0,令r→+∞,矛盾.
若α=0,则s≠0.由x∈˚E,∃δ>0,x+δs∈E.
⇒(s,x)+αf(x)≥(s,x+δs)+αf(x+δs)⇒0<δ|s|≤α(f(x)−f(x+δs))⇒α≠0.矛盾.
所以α<0.那么f(y)≥1|α|(s,y−x)+f(x)=f(x)+(s|α|,y−x).
(s,α)依赖于x⇒v(x)=s|α|.
分离性与支撑平面的几何解读
-
定义Rm上的超平面:若ξ∈Rmξ≠0,t∈R,则集合H:={x∈Rm|x⋅ξ=t}称为Rm上的超平面.相对该超平面,定义H+={x∈Rm|x⋅ξ≥t},H−={x∈Rm|x⋅ξ≤t},称为对应超平面的两个半空间.此时,ξ是平面H的法向量.
从超平面的角度解释上面的两个结论:
-
K是闭凸集,x∉K,令ξ=x−P(x).由凸投影定理,∃t∈R,(x,ξ)>t>supy∈K(y,ξ)⇒x∈H+,K⊂H−.
-
K是凸集,x0∈∂K,则∃ξ∈Rm,ξ≠0满足(ξ,x0)≥(ξ,y),∀y∈K.
若令H={x∈Rm|(ξ,x)=(ξ,x0)}则有x0∈∂K,x0∈H且K⊆H−.满足这两个条件的平面H称为K的支撑平面.
-
从几何的角度来看凸函数的支撑平面.
-
当m=1时,有f(y)≥f(x)+v(x)(y−x),∀y∈E.此时的支撑平面是一条直线L,可以认为L是由法向量(v(x),−1)和点(x,f(x))确定.此时沿着(v(x),−1)来看我们有{(y,f(y)|y∈E)}⊆L−.
-
m≤2时有Rm+1={(x,z)|x∈Rm,z∈R}.
由凸集的支撑平面可知存在→ξ以及超平面H满足{(y,f(y))|y∈E}⊆H−.
由于E={(y,z)|y∈E,z≥f(y)}.有→ξ⋅→em+1≤0.其中→em+1是最后一维的单位向量.
由于→ξ≠0,我们可以对其最后一维归一化,于是有→ξ=(v,−1).
从而H由(v,−1)与点(x,f(x))确定.即∀(y,z)∈Rm+1,(y,z)∈H⇒(y−x,z−f(x))⋅(v,−1)=0⇒z=f(x)+v(y−x).
因此{(y,f(y))|y∈E}⊆H−⇒f(y)≥f(x)+v(y−x).
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!