凸优化:凸集

凸优化是通信中常见的数学工具,本文主要总结《凸优化》一书中凸集章节的概念,并做简要注解。

仿射集合和凸集#

  1. 直线和线段:y=θx1+(1θ)x2=x2+θ(x1x2),x1x2
    • 直线:θR
    • 线段:θ[0,1]
  2. 仿射集合:
    • 仿射集合:若对于x1,x2C,θR,有θx1+(1θ)x2C,则称集合C是仿射的。
    • 仿射组合:若θ1+θ2++θk=1,则称具有θ1x1+θ2x2++θkxk形式的点为x1,x2,,xk的仿射组合。一个仿射集合包含其中任意点的仿射组合。
    • 仿射集合关联的子空间:V=Cx0,其中,x0C中的任意元素。仿射集合C的维数为仿射集合关联的子空间维数。
    • 线性方程组的解集是仿射集合,任意仿射集合均可以表示为一个线性方程组的解集。
      • C为仿射集合,则仿射集合C关联子空间的正交补中元素可以构造系数矩阵A,使得Av=0,vV。因此,对于集合C中任意元素xC,有Ax=A(v+x0)=Ax0b,即C={xAx=b}是一个线性方程组的解集。
      • 若集合C={xAx=b}是一个线性方程组的解集,任选x1,x2C满足Ax1=bAx2=b,任选θR,则仿射组合x=θx1+(1θ)x2满足Ax=θAx1+(1θ)Ax2=θb+(1θ)b=b,即xC,集合C为仿射集合。
    • 仿射包:由集合CRn中的点的所有仿射组合组成的集合为C的仿射包,记为affC
    • 仿射包是包含C的最小仿射集合,即:若S是满足CS的仿射集合,则affCS
  3. 仿射维数与相对内部:
    • 仿射维数:集合C的仿射维数定义为其仿射包的维数。
    • 相对内部:集合C的相对内部为affC的内部,记为relintC,即relintC={xCB(x,r)affCfor somer>0},其中,B(x,r)={yyxr}。容易得到,所有范数都定义了相同的相对内部。
    • 相对边界:集合C的相对边界为clCrelintC,其中,clC为集合C的闭包。
  4. 凸集:
    • 凸集:若对于x1,x2C,θ[0,1],有θx1+(1θ)x2C,则称集合C是凸集。
    • 凸组合:若θ1+θ2++θk=1,且θi[0,1],i=1,2,,k,则称具有θ1x1+θ2x2++θkxk形式的点为x1,x2,,xk的凸组合。
    • 一个凸集包含其中任意点的凸组合。
    • 凸包:由集合CRn中的点的所有凸组合组成的集合为C的凸包,记为convC
    • 凸包是包含C的最小凸集,即:若S是满足CS的凸集,则convCS
  5. 锥:
    • 锥:若对于xC,θ0,有θxC,则称集合C是锥或非负齐次。如果集合C是锥,且是凸的,则称集合C是凸锥。
    • 锥组合/锥包的定义与仿射集合/仿射包和凸集/凸包类似。
    • 集合C是凸锥的充要条件是集合C包含其元素的所有锥组合。

例子#

  1. 超平面与半空间:
    • 超平面:{xaTx=b},其中aR,a0bR,超平面是仿射集合。超平面由偏移x0加上所有正交于法向量a的向量构成,其中aTx0=b
    • 半空间:{xaTxb},其中aR,a0bR,半空间是凸集,但不是仿射集合。
    • 开半空间:{xaTx<b},其中aR,a0bR,开半空间是凸集,但不是仿射集合。
    • 半空间的边界是超平面,半空间的内部是开半空间。
  2. Euclid球和椭球:
    • Euclid球:B(xc,r)={x|xxc2r}={xc+ruu21},其中r>0,Euclid球是凸集。
    • 椭球:E={x(xxc)TP1(xxc)1}={xc+Auu21},其中P=PT0A=P1/2,椭球是凸集,且Euclid球可以看做P=r2I的椭球。
  3. 范数球和范数锥:
    • 范数球:B(xc,r)={x|xxcr},其中r>0,范数球是凸集。
    • 范数锥:C={(x,t)|xt},其中t>0,范数锥是凸锥。
  4. 多面体:
    • 多面体:P={x|ajTxbjj=1,2,,m,cjTx=dj,j=1,2,,p}={xAxb,Cx=d} ,多面体是有限个半空间和超平面的交集,仿射集合、射线、线段和半空间都是多面体。显然,多面体是凸集。
    • 单纯形:若k+1个点v0,v1,,vkRn仿射独立,则这些点的凸包为单纯形,即有C=conv{v0,v1,,vk}
      • 仿射相关:对于n个向量v1,,vn,若有n个不全为0的标量α1,,αn,满足α1v1++αnvn=0α1++αn=0,则称向量v1,,vn仿射相关;反之,称向量v1,,vn仿射独立。
      • 向量v1,,vn仿射独立的充要条件是向量v2v1,,vnv1线性独立。
      • 常见单纯形:线段(一维)、包含内部的三角形(二维)、四面体(三维)。
      • 单位单纯形:由0,e1,,en决定的n维单纯形,其中,元素x满足x0,且1Tx1
      • 概率单纯形:由e1,,en决定的n1维单纯形,其中,元素x满足x0,且1Tx=1。概率单纯形中的向量可以对应于含有n个元素集合的概率分布。
    • 有限集合的凸包是有界多面体,但一般无法利用形如多面体定义的形式进行表示。
  5. 半正定锥:对称半正定矩阵的集合S+n为凸锥。

保凸运算#

  1. 交集:凸集、子空间、仿射集合、凸锥对任意交运算封闭。
    • 多面体是半空间与超平面的交集,因此为凸的。
    • 半正定锥是无穷个半空间的交集,因此是凸的。
  2. 仿射函数:
    • 仿射函数:若函数f:RnRm具有f(x)=Ax+b的形式,其中ARm×nbRm,则称函数f是仿射的。
    • 凸集在仿射函数下的象和原象都是凸的,例:伸缩、平移、投影、和、直积、部分和。
  3. 透视函数及线性分式函数:
    • 透视函数:若函数P:Rn+1Rn具有P(z,t)=z/t的形式,则称函数P是透视函数,定义域domP=Rn×R++。透视函数对向量进行伸缩变换,使最后一维分量为1并舍弃。
    • 凸集在透视函数下的象和原象都是凸的。
    • 线性分式函数:若函数g:RnRm+1是仿射函数,则函数f=Pg:RnRm称为线性分式函数(或投射函数)。
    • 凸集在线性分式函数下的象和原象都是凸的。

广义不等式#

  1. 正常锥与广义不等式:
    • 正常锥:如果锥KRn是凸的、闭的(闭包即为本身)、实的(包含非空内部)且尖的(不存在非零元素xK使得xK),则称锥K为正常锥。例:半空间不是正常锥,因为其包含直线(不是尖的)。
    • 广义不等式:正常锥K可以定义偏序关系xKyyxK,也可以定义严格偏序关系xKyyxintK
    • 广义不等式性质:
      • 加法保序:若xKyuKv,则x+uKy+v
      • 非负数乘保序:若xKyα0,则αxKαy
      • 极限运算保序:若xiKyi,i=1,2,,且irightarrow时,有xirightarrowxyirightarrowy,则xKy
      • 传递性:若xKyyKz,则xKz
      • 自反性:xKx
      • 反对称性:若xKyyKx,则x=y
    • 为什么定义正常锥:正常锥可以保证广义不等式所定义偏序关系的性质成立且有意义,正常锥的定义可以与偏序关系的性质一一关联。
      • 对于锥K,有0K。因此,有aKa(自反性)成立。对于锥K,若v=xyK,有αv=α(xy)inK。因此,若xKy,有αxKαy(非负数乘保序性)成立。
      • 对于凸锥K,若u=xyKv=yzK,有u+v=xzK。因此,若xKyyKz,有xKz(传递性)成立。
      • 对于尖集K,若u=xyKu=yxK,有u=xy=0。因此,若xKyyKx,有x=y(反对称性)成立。
      • 对于闭集K,若点列{ui=xiyiC}收敛至u=xy,则u=xyC。因此,若xiKyi,且xiyi分别收敛至xy,有xKy(极限保序性)成立。
      • 对于实集K,其内部intK。因此,有xyintK(严格偏序xy有意义)成立。
  2. 最小与极小元
    • 偏序关系与线性序的区别:线性序下的任意元素都是可比的,而对于偏序关系,未必所有的元素都是可比的。
    • 最小元:若yS,都有xKy,则称xSS关于广义不等式K的最小元。如果集合有最小元,则最小元是唯一的。对于集合S,元素xS是集合S最小元的充要条件是Sx+K。从定义可以看出,集合存在最小元意味着集合中的元素都是可比的。
    • 极小元:若由ySyKx可以推得y=x,则称xSS关于广义不等式K的极小元。对于集合S,元素xS是集合S极小元的充要条件是(xK)S={x}。从定义可以看出,集合中可比元素中的最小元一定是极小元,因此集合可能存在多个极小元。

分离与支撑超平面#

  1. 超平面分离定理:
    • 超平面分离定理:若凸集CD满足CD=,那么存在a0b,使得对于xC,有aTxb,且对于xD,有aTxb。此时,超平面{xaTx=b}称为集合C和集合D的分离超平面。
    • 严格分离:若凸集CD满足CD=,且对于a0b,有xC,有aTx<b,且对于xD,有aTx>b,则称超平面{xaTx=b}将凸集CD严格分离。不想交的闭凸集不一定能被超平面严格分离,例如凸集C={(x,y)x0}和凸集D={(x,y)xy1,x0,y0}
    • 超平面分离逆定理:对于任意两个凸集CD,若其中至少有一个为开集,那么集合CD不相交的充要条件是集合CD存在分离超平面。
    • 严格线性不等式的择一定理:Axbλ0,λ0,ATλ=0,λTb0对于任意Ab,择一成立。其中,集合C={bAxxRn}和集合D=R++m={yRmy0}的分离超平面为{xλTx=μ}
  2. 支撑超平面:
    • 定义:设集合CRnx0为边界bdC上的一点,即x0bdC=clCintC,若a0,且对于xC,有aTxaTx0,则超平面{xaTx=aTx0}称为集合C的支撑超平面。
    • 支撑超平面定理:对于任意非空凸集C和任意x0bdC,在x0处均存在集合C的支撑超平面。
    • 支撑超平面逆定理:若一个集合是闭的,且具有非空内部,并且其边界每一个点均存在支撑超平面,则该集合是凸集。

对偶锥与广义不等式#

  1. 对偶锥:令集合K为一个锥,集合K={yxTy0,xK}称为K的对偶锥。从几何上看,yK的充要条件是y为集合K在原点的一个支撑超平面的法线。
    • 例子:
      • 子空间VRn的对偶锥是其正交补V={yyTx=0,xV}:由于V是子空间,因此当xV时,有xV。若yK,则有yTx0yT(x)0同时成立,即等价于yTx=0
      • R+n的对偶锥是其本身:反证法易证,yTx0,x0y0
      • S+n的对偶锥是其本身:反证法易证,Tr(XY)0,X0Y0
      • 范数锥的对偶锥为对偶范数锥,其中范数的对偶范数为u=sup{uTxx1}:反证法易证,对于xtxTu+tv0uv
    • 性质:
      • K是闭凸锥;
      • K1K2,则K2K1
      • K有非空内部,则K是尖的。
      • K的闭包是尖的,则K有非空内部。
      • KK的凸包的闭包,若K是凸和闭的,则K=K
  2. 广义不等式的对偶:
    • 广义不等式K为广义不等式K的对偶。
    • 性质:
      • xKy的充要条件是对于任意λK0,有λTxλTy
      • xKy的充要条件是对于任意λK0λ0,有λTx<λTy
      • 线性严格广义不等式的择一定理:AxKbλ0,λK0,ATλ=0,λTb0对于任意Ab,择一成立。其中,集合C={bAxxRn}和集合D=intK的分离超平面为{xλTx=μ}
  3. 对偶不等式的最小元和极小元:
    • 最小元:元素xS是集合S最小元的充要条件对于所有λK0x是在zS上极小化λTz的唯一最优解。从几何上看,元素xS是集合S最小元意味着对于所有λK0,超平面{zλT(zx)=0}是在x处对S的一个严格支撑超平面。
    • 极小元:元素xS是集合S极小元的充要条件对于所有λK0xzS上极小化λTz。当集合S为凸集时,对于任意极小元x,存在非零λK0,使得xzS上极小化λTz

作者:Infinity-SEU

出处:https://www.cnblogs.com/Infinity-SEU/p/convex_optimization_convex_set.html

版权:本作品采用「署名-非商业性使用-相同方式共享 4.0 国际」许可协议进行许可。

posted @   Infinity-SEU  阅读(787)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 提示词工程——AI应用必不可少的技术
· 地球OL攻略 —— 某应届生求职总结
· 字符编码:从基础到乱码解决
· SpringCloud带你走进微服务的世界
点击右上角即可分享
微信分享提示
workspaces
keyboard_arrow_up light_mode palette
选择主题
menu