凸优化是通信中常见的数学工具,本文主要总结《凸优化》一书中凸集章节的概念,并做简要注解。
仿射集合和凸集#
- 直线和线段:y=θx1+(1−θ)x2=x2+θ(x1−x2),x1≠x2
- 直线:θ∈R。
- 线段:θ∈[0,1]。
- 仿射集合:
- 仿射集合:若对于∀x1,x2∈C,θ∈R,有θx1+(1−θ)x2∈C,则称集合C是仿射的。
- 仿射组合:若θ1+θ2+…+θk=1,则称具有θ1x1+θ2x2+…+θkxk形式的点为x1,x2,…,xk的仿射组合。一个仿射集合包含其中任意点的仿射组合。
- 仿射集合关联的子空间:V=C−x0,其中,x0为C中的任意元素。仿射集合C的维数为仿射集合关联的子空间维数。
- 线性方程组的解集是仿射集合,任意仿射集合均可以表示为一个线性方程组的解集。
- 若C为仿射集合,则仿射集合C关联子空间的正交补中元素可以构造系数矩阵A,使得Av=0,∀v∈V。因此,对于集合C中任意元素x∈C,有Ax=A(v+x0)=Ax0≜b,即C={x∣Ax=b}是一个线性方程组的解集。
- 若集合C={x∣Ax=b}是一个线性方程组的解集,任选x1,x2∈C满足Ax1=b且Ax2=b,任选θ∈R,则仿射组合x=θx1+(1−θ)x2满足Ax=θAx1+(1−θ)Ax2=θb+(1−θ)b=b,即x∈C,集合C为仿射集合。
- 仿射包:由集合C⊆Rn中的点的所有仿射组合组成的集合为C的仿射包,记为affC。
- 仿射包是包含C的最小仿射集合,即:若S是满足C⊆S的仿射集合,则affC⊆S。
- 仿射维数与相对内部:
- 仿射维数:集合C的仿射维数定义为其仿射包的维数。
- 相对内部:集合C的相对内部为affC的内部,记为relintC,即relintC={x∈C∣B(x,r)∩affCfor somer>0},其中,B(x,r)={y∣∥y−x∥≤r}。容易得到,所有范数都定义了相同的相对内部。
- 相对边界:集合C的相对边界为clC∖relintC,其中,clC为集合C的闭包。
- 凸集:
- 凸集:若对于∀x1,x2∈C,θ∈[0,1],有θx1+(1−θ)x2∈C,则称集合C是凸集。
- 凸组合:若θ1+θ2+…+θk=1,且θi∈[0,1],i=1,2,…,k,则称具有θ1x1+θ2x2+…+θkxk形式的点为x1,x2,…,xk的凸组合。
- 一个凸集包含其中任意点的凸组合。
- 凸包:由集合C⊆Rn中的点的所有凸组合组成的集合为C的凸包,记为convC。
- 凸包是包含C的最小凸集,即:若S是满足C⊆S的凸集,则convC⊆S。
- 锥:
- 锥:若对于∀x∈C,θ≥0,有θx∈C,则称集合C是锥或非负齐次。如果集合C是锥,且是凸的,则称集合C是凸锥。
- 锥组合/锥包的定义与仿射集合/仿射包和凸集/凸包类似。
- 集合C是凸锥的充要条件是集合C包含其元素的所有锥组合。
- 超平面与半空间:
- 超平面:{x∣aTx=b},其中a∈R,a≠0且b∈R,超平面是仿射集合。超平面由偏移x0加上所有正交于法向量a的向量构成,其中aTx0=b。
- 半空间:{x∣aTx≤b},其中a∈R,a≠0且b∈R,半空间是凸集,但不是仿射集合。
- 开半空间:{x∣aTx<b},其中a∈R,a≠0且b∈R,开半空间是凸集,但不是仿射集合。
- 半空间的边界是超平面,半空间的内部是开半空间。
- Euclid球和椭球:
- Euclid球:B(xc,r)={x|∥x−xc∥2≤r}={xc+ru∣∥u∥2≤1},其中r>0,Euclid球是凸集。
- 椭球:E={x∣(x−xc)TP−1(x−xc)≤1}={xc+Au∣∥u∥2≤1},其中P=PT≻0,A=P1/2,椭球是凸集,且Euclid球可以看做P=r2I的椭球。
- 范数球和范数锥:
- 范数球:B(xc,r)={x|∥x−xc∥≤r},其中r>0,范数球是凸集。
- 范数锥:C={(x,t)|∥x∥≤t},其中t>0,范数锥是凸锥。
- 多面体:
- 多面体:P={x|aTjx≤bj,j=1,2,…,m,cTjx=dj,j=1,2,…,p}={x∣Ax⪯b,Cx=d} ,多面体是有限个半空间和超平面的交集,仿射集合、射线、线段和半空间都是多面体。显然,多面体是凸集。
- 单纯形:若k+1个点v0,v1,…,vk∈Rn仿射独立,则这些点的凸包为单纯形,即有C=conv{v0,v1,…,vk}。
- 仿射相关:对于n个向量v1,…,vn,若有n个不全为0的标量α1,…,αn,满足α1v1+…+αnvn=0且α1+…+αn=0,则称向量v1,…,vn仿射相关;反之,称向量v1,…,vn仿射独立。
- 向量v1,…,vn仿射独立的充要条件是向量v2−v1,…,vn−v1线性独立。
- 常见单纯形:线段(一维)、包含内部的三角形(二维)、四面体(三维)。
- 单位单纯形:由0,e1,…,en决定的n维单纯形,其中,元素x满足x⪰0,且1Tx≤1。
- 概率单纯形:由e1,…,en决定的n−1维单纯形,其中,元素x满足x⪰0,且1Tx=1。概率单纯形中的向量可以对应于含有n个元素集合的概率分布。
- 有限集合的凸包是有界多面体,但一般无法利用形如多面体定义的形式进行表示。
- 半正定锥:对称半正定矩阵的集合Sn+为凸锥。
保凸运算#
- 交集:凸集、子空间、仿射集合、凸锥对任意交运算封闭。
- 多面体是半空间与超平面的交集,因此为凸的。
- 半正定锥是无穷个半空间的交集,因此是凸的。
- 仿射函数:
- 仿射函数:若函数f:Rn→Rm具有f(x)=Ax+b的形式,其中A∈Rm×n,b∈Rm,则称函数f是仿射的。
- 凸集在仿射函数下的象和原象都是凸的,例:伸缩、平移、投影、和、直积、部分和。
- 透视函数及线性分式函数:
- 透视函数:若函数P:Rn+1→Rn具有P(z,t)=z/t的形式,则称函数P是透视函数,定义域domP=Rn×R++。透视函数对向量进行伸缩变换,使最后一维分量为1并舍弃。
- 凸集在透视函数下的象和原象都是凸的。
- 线性分式函数:若函数g:Rn→Rm+1是仿射函数,则函数f=P∘g:Rn→Rm称为线性分式函数(或投射函数)。
- 凸集在线性分式函数下的象和原象都是凸的。
广义不等式#
- 正常锥与广义不等式:
- 正常锥:如果锥K⊆Rn是凸的、闭的(闭包即为本身)、实的(包含非空内部)且尖的(不存在非零元素x∈K使得−x∈K),则称锥K为正常锥。例:半空间不是正常锥,因为其包含直线(不是尖的)。
- 广义不等式:正常锥K可以定义偏序关系x⪯Ky⇔y−x∈K,也可以定义严格偏序关系x≺Ky⇔y−x∈intK。
- 广义不等式性质:
- 加法保序:若x⪯Ky且u⪯Kv,则x+u⪯Ky+v。
- 非负数乘保序:若x⪯Ky且α≥0,则αx⪯Kαy。
- 极限运算保序:若xi⪯Kyi,i=1,2,…,且irightarrow∞时,有xirightarrowx和yirightarrowy,则x⪯Ky。
- 传递性:若x⪯Ky且y⪯Kz,则x⪯Kz。
- 自反性:x⪯Kx。
- 反对称性:若x⪯Ky且y⪯Kx,则x=y。
- 为什么定义正常锥:正常锥可以保证广义不等式所定义偏序关系的性质成立且有意义,正常锥的定义可以与偏序关系的性质一一关联。
- 对于锥K,有0∈K。因此,有a⪰Ka(自反性)成立。对于锥K,若v=x−y∈K,有αv=α(x−y)inK。因此,若x⪰Ky,有αx⪰Kαy(非负数乘保序性)成立。
- 对于凸锥K,若u=x−y∈K且v=y−z∈K,有u+v=x−z∈K。因此,若x⪰Ky且y⪰Kz,有x⪰Kz(传递性)成立。
- 对于尖集K,若u=x−y∈K且−u=y−x∈K,有u=x−y=0。因此,若x⪰Ky且y⪰Kx,有x=y(反对称性)成立。
- 对于闭集K,若点列{ui=xi−yi∈C}收敛至u=x−y,则u=x−y∈C。因此,若xi⪰Kyi,且xi和yi分别收敛至x和y,有x⪰Ky(极限保序性)成立。
- 对于实集K,其内部intK≠∅。因此,有x−y∈intK≠∅(严格偏序x≻y有意义)成立。
- 最小与极小元
- 偏序关系与线性序的区别:线性序下的任意元素都是可比的,而对于偏序关系,未必所有的元素都是可比的。
- 最小元:若∀y∈S,都有x⪯Ky,则称x∈S为S关于广义不等式⪯K的最小元。如果集合有最小元,则最小元是唯一的。对于集合S,元素x∈S是集合S最小元的充要条件是S⊆x+K。从定义可以看出,集合存在最小元意味着集合中的元素都是可比的。
- 极小元:若由y∈S和y⪯Kx可以推得y=x,则称x∈S为S关于广义不等式⪯K的极小元。对于集合S,元素x∈S是集合S极小元的充要条件是(x−K)∩S={x}。从定义可以看出,集合中可比元素中的最小元一定是极小元,因此集合可能存在多个极小元。
分离与支撑超平面#
- 超平面分离定理:
- 超平面分离定理:若凸集C和D满足C∩D=∅,那么存在a≠0和b,使得对于∀x∈C,有aTx≤b,且对于∀x∈D,有aTx≥b。此时,超平面{x∣aTx=b}称为集合C和集合D的分离超平面。
- 严格分离:若凸集C和D满足C∩D=∅,且对于a≠0和b,有∀x∈C,有aTx<b,且对于∀x∈D,有aTx>b,则称超平面{x∣aTx=b}将凸集C和D严格分离。不想交的闭凸集不一定能被超平面严格分离,例如凸集C={(x,y)∣x≤0}和凸集D={(x,y)∣xy≥1,x≥0,y≥0}。
- 超平面分离逆定理:对于任意两个凸集C和D,若其中至少有一个为开集,那么集合C与D不相交的充要条件是集合C与D存在分离超平面。
- 严格线性不等式的择一定理:Ax≺b和λ≠0,λ⪰0,ATλ=0,λTb≤0对于任意A和b,择一成立。其中,集合C={b−Ax∣x∈Rn}和集合D=Rm++={y∈Rm∣y⪰0}的分离超平面为{x∣λTx=μ}。
- 支撑超平面:
- 定义:设集合C⊆Rn,x0为边界bdC上的一点,即x0∈bdC=clC∖intC,若a≠0,且对于∀x∈C,有aTx≤aTx0,则超平面{x∣aTx=aTx0}称为集合C的支撑超平面。
- 支撑超平面定理:对于任意非空凸集C和任意x0∈bdC,在x0处均存在集合C的支撑超平面。
- 支撑超平面逆定理:若一个集合是闭的,且具有非空内部,并且其边界每一个点均存在支撑超平面,则该集合是凸集。
对偶锥与广义不等式#
- 对偶锥:令集合K为一个锥,集合K∗={y∣xTy≥0,∀x∈K}称为K的对偶锥。从几何上看,y∈K∗的充要条件是−y为集合K在原点的一个支撑超平面的法线。
- 例子:
- 子空间V⊆Rn的对偶锥是其正交补V⊥={y∣yTx=0,x∈V}:由于V是子空间,因此当x∈V时,有−x∈V。若y∈K∗,则有yTx≥0和yT(−x)≥0同时成立,即等价于yTx=0。
- Rn+的对偶锥是其本身:反证法易证,yTx≥0,∀x⪰0⇔y⪰0。
- Sn+的对偶锥是其本身:反证法易证,Tr(XY)≥0,∀X⪰0⇔Y⪰0。
- 范数锥的对偶锥为对偶范数锥,其中范数∥⋅∥的对偶范数为∥u∥∗=sup{uTx∣∥x∥≤1}:反证法易证,对于∥x∥≤t,xTu+tv≥0⇔∥u∥∗≤v。
- 性质:
- K∗是闭凸锥;
- 若K1⊆K2,则K∗2⊆K∗1。
- 若K有非空内部,则K∗是尖的。
- 若K的闭包是尖的,则K∗有非空内部。
- K∗∗是K的凸包的闭包,若K是凸和闭的,则K∗∗=K。
- 广义不等式的对偶:
- 广义不等式⪯K∗为广义不等式⪯K的对偶。
- 性质:
- x⪯Ky的充要条件是对于任意λ⪰K∗0,有λTx≤λTy。
- x≺Ky的充要条件是对于任意λ⪰K∗0和λ≠0,有λTx<λTy。
- 线性严格广义不等式的择一定理:Ax≺Kb和λ≠0,λ⪰K∗0,ATλ=0,λTb≤0对于任意A和b,择一成立。其中,集合C={b−Ax∣x∈Rn}和集合D=intK的分离超平面为{x∣λTx=μ}。
- 对偶不等式的最小元和极小元:
- 最小元:元素x∈S是集合S最小元的充要条件对于所有λ≻K∗0,x是在z∈S上极小化λTz的唯一最优解。从几何上看,元素x∈S是集合S最小元意味着对于所有λ≻K∗0,超平面{z∣λT(z−x)=0}是在x处对S的一个严格支撑超平面。
- 极小元:元素x∈S是集合S极小元的充要条件对于所有λ≻K∗0,x在z∈S上极小化λTz。当集合S为凸集时,对于任意极小元x,存在非零λ⪰K∗0,使得x在z∈S上极小化λTz。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 提示词工程——AI应用必不可少的技术
· 地球OL攻略 —— 某应届生求职总结
· 字符编码:从基础到乱码解决
· SpringCloud带你走进微服务的世界