最优化方法_Part1

1 最优化问题概述

1.1 什么是最优化问题

最优化问题是决策问题,选择一些可以执行的策略来使得目标最优,一个最优化问题包括:

  • 决策变量
  • 一个或多个目标函数
  • 一个由可行策略纽成的集合,可由等式或者不等式刻画

1.2 基本形式

1.2.1 视频中的形式

{min or maxf(x) s.t. gi(x)0,i=1,,mhi(x)=0,i=1,,l

其中,x=(x1,x2,,xn)TX决策变量X表示给定的集合,比如R+nZn等。

  • f(x)即目标函数,gi(x)0,hi(x)=0分别为不等式约束和等式约束
  • 集合S={xXgi(x)0, i=1,,m,hi(x)=0, i=1,,l}称为最优化问题的可行集(可行域)
1.2.2 参考其他文献的形式

{ min f(x) s.t.xX

其中,x=(x1,x2,···,xn)TRn决策变量f:RnR目标函数XRn约束集合或可行域,可行域包含的点称为可行解或可行点。记号 s.t.是 “subject to”的缩写,专指约束条件。当X=Rn时,上式称为无约束优化问题。集合X通常可以由约束函数ci(x):RnR,i=1,2,···,m+l表达为如下具体形式:

X={xRnci(x)0,i=1,2,,mci(x)=0,i=m+1,m+2,m+l}

参考资料1:课本——最优化:建模、算法与理论

参考资料2:https://blog.csdn.net/jbb0523/article/details/50596387

1.3 最优化问题分类

1.3.1 无约束优化/约束优化
  • 无约束优化问题:没有约束条件
    • 常见求解方法:梯度下降法(最速下降法)、牛顿法、共轭梯度法等等
  • 约束优化问题:在一定约束条件下求解目标函数的min OR max

易知,实际中最碰见的是约束优化问题,但是我们在课程中却要大量研究无约束优化问题,这个有两方面的原因:一是无约束优化问题求解相对简单;二是可以通过一定的变换将有约束转变为无约束优化。

1.3.2 线性/非线性优化
  • 线性优化问题的一般形式

{ min Cx s.t.Ax=b

单纯形方法:在数学优化领域中常用于线性规划问题的数值求解。由线性规划问题的可行集的特征来决定的(线性规划最优解存在时,那么最优解一定存在与问题可行集的顶点位置),单纯性方法就是关注这些顶点。

参考资料:单纯形算法

  • 非线性优化(例子说明):均值-方差模型
1.3.3 连续优化/离散优化
  • 连续优化:x=(x1,x2,,xn)TX中每一个xn的取值是连续的
  • 离散优化:x=(x1,x2,,xn)TX中每一个xn的取值是离散的,比如01规划
1.3.4 单目标优化/多目标优化
  • 单目标优化
  • 多目标优化(均值-方差模型)常采用的办法:
    • 法1:转化为单目标,即可以将某些目标经过一定形式转化到约束条件中去。
    • 法2:想办法将多个目标融合为单个目标
1.3.5 动态规划
1.3.6 随机规划

参数中有不确定系数的优化问题。

1.3.7 鲁棒优化

1.4 最优化方法主要讲解内容

  • 凸优化理论:凸集,凸函数,凸优化问题;
  • 无约束优化问题的算法;
  • 约束优化的最优性条件及对偶理论;
  • 线性规划、二次规划算法;
  • 约束优化的罚函数方法;
  • 优化软件:CVX,CPLEX

1.5 预备知识

  • 向量、矩阵、二次型等知识;
  • 微积分知识;
  • 简单的概率知识。

课后小问题:

  • n元二次函数f(x)=xTHxcTx,其中Hn阶对称矩阵,cn维向量;给出f(x)的梯度和hesse炬阵?
  • 设随机向量服从联合正态分布:ϵ=(ϵ1,ϵ2,,ϵn)N(μ,σ2),令η=x1ϵ1++xnϵn,给出ηc分位数。

2 凸集

在最优化范畴里面,凸优化问题是一类常见的且性质很好的(很多时候可以帮助我们解决非凸优化问题)。

如果目标函数f(x)是一个凸函数,可行集S或者X是凸集,通常来讲就是凸优化问题。

  • 为什么凸优化问题具有比较好的性质呢?
    • 例子1:一元最小化问题:min f(x), s.t. x[a,b]
凸函数 非凸函数
    • 例子2:二元最小化问题:min f(x1,x2)=x12+x22, s.t. xS
凸集 非凸集
梯度:f(x) 梯度:f(x)
优化问题等价为:θ>90°f(x)(xx)0,xS 优化问题等价为:θ>90°f(x)(xx)0,xS

凸集:集合中的任意两点连线的点都在该集合中,则称该集合为凸集;凹集为非凸集。

2.1 凸集的定义

2.1.1 凸集定义的数学表示

凸集:对于任意的x,yC与任意λ[0,1],有

λx+(1λ)yC

那么C为凸集。凸集中任意两点连线的点都在该集合中。

  • 推广表示方法:

λ1x1++λkxkC, x1,,xkC

其中,λi0,λ1++λk=1

2.1.2 凸组合

凸组合是指,假设x1,x2,,xn是一组对象(要根据讨论问题的背景来确定),λ1,λ2,,λkk个常数,并且满足λi0,λ1++λk=1,那么这些点的凸组合即一个这样的点:

λ1x1++λkxk 

就称为x1,x2,,xn的凸组合。注意区分线性组合,仿射组合,非负组合,凸组合

通常你看到凸组合只意味着一个意思:线性组合,系数和为一

任意两个点的凸组合都在它们之间的线段上。

2.1.3 凸包

凸包是针对一个集合来说的。任意一个集合(不一定是凸集)C,其中的点的凸组合构成的集合就称为凸包。

点集的凸包等价于该点集的所有凸组合。

凸包一定是凸集合,通过凸包操作能够将非凸集合转变为凸集合。

2.2 常见凸集

2.2.1 超平面
  • 定义:n维线性空间中维度为n1的子空间,它可以把线性空间分割为不相交的两部分。

    这里的n必须大于3,其子空间才能称之为超平面。

    更直观理解超平面:其实就是平面中的直线、空间中的平面的推广。在三维坐标系,XoY平面把三维坐标系”分割”成两个空间,这个分割平面引申到一维,二维,四维空间…来,他就是一个超平面。

  • 超平面方程推导:

H={x|aTx=b,(a0)}

式中,aT垂直于超平面x

参考资料1:机器学习01-超平面理解

参考资料2:超平面是什么?——理解超平面(SVM开篇之超平面详解)

2.2.2 半空间

H+={x|aTxb,(a0)}

H={x|aTxb,(a0)}

2.2.3 多面体
  • 定义:多个线性不等式所刻画的集合

{xaiTxbi,i=1,,m}

注意:线性等式刻画的集合也是多面体,因为等式约束可以转换为不等式约束,如

aiTx=bi{aiTxbiaiTxbi

2.2.4 球体(Euclidean)ball with center xcand radius r

B(xc,r)={xxxc2r}={xc+ruu21}

式中,xc为球心,r为半径,u表示某一距离长度范围。

2.2.5 椭球(Ellipsoid)

{x(xxc)TP1(xxc)1}

其中P正定矩阵;椭球的半轴长为λi(λi为正定矩阵的特征值)。

2.2.6 二阶(次)锥 Second-order cone, ice-cream cone

假设有一个n+1维的锥,其前面n维写为x,最后第n+1维分量记为t

{(x,t)||x||2t}

什么是锥:

如果xC,那么若有λxC,λ0,此时就称为锥。

2.2.7 半定矩阵锥
  • Sn:所有n对称矩阵组成的集合;

  • S+n={XSnX0}:所有半正定矩阵组成的集合,其中:X0zTXz0,z

  • S++n={XSnX0}:所有正定矩阵的集合,其中:X0zTXz>0,z

半定矩阵锥常用于半定规划里面(一种常见的凸优化问题)。

  • 例子:[xyyx]S+2,如下图所示。

小问题:

线性规划

min{cTxAx=b,x0}

的最优解组成的集合为SS是凸集合吗?【答案——S是凸集合】

证明:

x1,x2S,cTx1=cTx2=vλ[0,1],λx1+(1λ)x2ScT(λx1+(1λ)x2)=λcTx1+(1λ)cTx2=vS

2.3 保持集合凸性的运算

2.3.1 第一种

C1,C2Rn是凸集,aR

  • (1)C1C2={xxC1,xC2}是凸集
  • (2)C1±C2={x±yxC1,yC2}是凸集

问题:S={xRn|p(t)|1,|t∣≤π/3},其中p(t)=i=1nxicosit是否为凸集?

答:带入p(t)得到:1x1cost+x2cos2t++xncosnt1

上不等式表示两个半空间交集。如果t只有两种取值,那么就是两个上不等式刻画的集合的交;事实上t无穷多取值,那么就是无穷多个上不等式刻画的集合的交,即结果仍然是凸集。

2.3.2 仿射变换

线性变换是特殊的仿射变换。或者说仿射变换就是线性变换加平移

假设f:RnRm是仿射函数,即f(x)=Ax+b,ARm×n,bRm

  • Cf(C)={f(x)xC}凸集
  • Cf1(C)={xf(x)C}凸集

特殊仿射变换:

  • 放缩scaling:αC={αxxC}
  • 平移translation:x0+C={x0+xxC}
  • 投影projection:{x1(x1x2)C}

2.4 凸集的基本性质——投影定理

2.4.1 投影定理概念

CRn是一个非空闭凸集,yRn,yC,则:

(1)存在唯一的一点xC,使得xyC的距离最小的点(即投影点),即有

||xy||=inf{||xy||xC}>0

(2)xyC的投影点(最小距离点)的充要条件是:

(xx)T(yx)0,xC

2.4.2 投影定理的证明

不妨设,xx都是投影点,则:||xy||=||xy||

存在x^xx两点之间,并作为连接三角形的中垂线,而小于其他两条边,从而小于投影点距离,矛盾!

因此投影点是唯一的。

2.4.3 点与凸集的分离
  • 分离

C1,C2Rn是两个非空凸集,若非零aRnb使得:

aTxb,xC1,aTzb,zC2

aTxaTz,xC1,zC2

则称超平面H={xaTx=b}分离集合C1,C2

  • 严格分离

C1,C2Rn是两个非空凸集,若非零aRnb使得:

aTx>b,xC1,aTz<b,zC2

aTx>aTz,xC1,zC2

则称超平面H={xaTx=b}严格分离集合C1,C2

小问题1:两个不相交的非空凸集一定能分离吗?

答:一定能分离。

小问题2:设CRn是两个非空闭凸集,yC,是否存在超平面分离yC

答:存在

2.5 支撑超平面定理

符号 意义
C 集合C的边界
int C 集合C所有内点表示的集合
cC 闭包,集合C内点、边界点放在一起组成的集合(有界闭集合)

CRn是非空凸集,xC(意思是xC的边界点),则存在非零向量aRn使得:

aTxaTx,xc|C

其中,c|C是凸集C的全域,称为闭包,包括内部和边界。当C不是紧的的时候,c|C也是指C的全域,即包括C不包括的边界。

此时,也称超平面H={xRnaTx=aTx}是集合Cx处的支撑超平面

通俗来说,该定理描述为:在凸集C的边界一点x寻找一个超平面H,将凸集C放在超平面负半空间中。

  • 证明:

由于xC,则xkx(点列,收敛x),且xkc|C

因为xkc|C,则存在ak(0)(边界点法向量),使得:

akTxakTxk,xc|C

不妨设,||ak||=1,则{ak}存在收敛子列。

令上式中k得:

aTxaTx,xc|C

参考链接:https://blog.csdn.net/qq_42518956/article/details/113943943

2.6 凸集之Farkas引理

Farkas引理好像可以用于升维度

2.6.1 Farkas引理定义

给定矩阵Am×n以及n维向量c,则以下两个问题有且只有一个有解

  • 问题1——Ax0,cTx>0
  • 问题2——ATy=c,y0

Farkas引理在几何上讨论矩阵A的行向量与向量c位置关系

矩阵

A=[a11a12a1na21a22a2nam1am2amn]=[a1Ta2TamT]

其中,ain维列向量,将其带入问题1、2可得:

  • 问题1——aiTx0(i=1,2,,m),cTx>0
  • 问题2——ATy=(a1,a2,,am)[y1y2ym]=c,yi0(i=1,2,,m)
情况1 情况2
2.6.2 Farkas引理证明
  • 证明方法1:
  • 证明方法2:利用线性规划对偶理论
2.6.3 Farkas引理的推论
  • Gordan定理:给定矩阵Am×n,则以下两个问题有且只有一个有解

    • 问题1——Ax<0
    • 问题2——ATy=0,y0,y0
  • 给定矩阵Am×n以及n维向量以及n维向量c,则以下两个问题有且只有一个有解

    • 问题1——Ax0,x0,cTx>0
    • 问题2——ATyc,y0
  • 其他还有好几个推论。。。

3 凸函数

3.1 凸函数与凹函数定义

3.1.1 凸函数

C为非空凸集,f是定义在C上的函数,如果对任意的x,yC,α(0,1),均有:

f(αx+(1α)y)αf(x)+(1α)f(y)

则称fC上的凸函数

3.1.2 严格凸函数

f(αx+(1α)y)<αf(x)+(1α)f(y)

3.1.3 凹函数

C为非空凸集,f是定义在C上的函数,如果对任意的x,yC,α(0,1),均有:

f(αx+(1α)y)αf(x)+(1α)f(y)

则称fC上的凹函数

3.1.4 严格凹函数

f(αx+(1α)y)>αf(x)+(1α)f(y)

f是凸函数,那么f为凹函数。

如果原来要求解一个凹函数f(x)的最大值,则可以转换为凸函数的最小值:

maxf(x)minf(x)

3.2 常见凸函数

3.2.1 线性函数

f(x)=aTx+b

该函数很特殊,它既唯一一类是凸函数又是凹函数。

3.2.2 二次函数

f(x)=xTQx+aTx+b,QS+n

其中QS+n是指Q半正定矩阵。该式子涉及二次型的知识。

3.2.3 最小二乘函数

f(x)=||Axb||22

3.2.4 p范数

f(x)=(i=1n|xi|p)1p,p1

0范数:f(x)=||x||0表示向量x0元素的个数

3.3 凸函数的性质

3.3.1 连续性

一个函数若是凸函数,那么该函数一定是连续函数。

3.3.2 性质2

f(x)为凸函数,等价于对任意的x,yRn,一元函数:

φ(α)=f(x+αy)

为凸函数。相当于把函数竖着切一下得到的切面???

3.3.3 性质3——判定凸函数的一阶条件

f(x)C上的凸函数的充要条件为:

f(y)f(x)+f(x)T(yx),x,yC

几何上的意义就是f(x)要在经过某一点的切面的上方,注意到上式中右式为函数在点处的一阶泰勒展开,在n=1情形下的几何意义如下图:

对应的切线方程为:g(y)=f(x)+f(x)T(yx)

证明:参考网络上的一些博客/b站视频。

3.3.4 性质4——判定凸函数的二阶条件

一阶条件在工作中很少被使用,我们往往使用的是二阶条件来判定函数的凸性。

二阶条件涉及到了Hessian matrix,它是这样定义的。

在数学中,海森矩阵(Hessian matrix 或 Hessian)是一个多变量实值函数的二阶偏导数组成的方块矩阵,假设有一实数函数f(x1,x2,...,xn),如果f所有的二阶偏导数都存在,那么f的海森矩阵是长下面这样:

CRn是非空开凸集,f(x)C上二阶连续可微,则f(x)C上的凸函数,等价于f(x)的二阶Hessian matrix:

2f(x)0,xC

即函数的二阶Hessian matrix需要是半正定的

对于CR上的函数, 上式退化为ddx(dfdx)=f(x)0. 该条件表明函数f的导数非减,从几何上解释就是函数f在点x处具有向上(正)的曲率。

3.4 保持函数凸性的运算

3.4.1 Perspective function

f(x)为凸函数,则:

g(x,t)=tf(xt),t>0

为凸函数,设f(x)=x2,则g(x,t)的可视化如下图所示。

3.4.2 非负组合

设有一组凸函数:f1(x),f2(x),,fm(x),则有:

g(x)=w1f1(x)+w2f2(x)++wmfm(x),wi0

为凸函数。

3.4.3 凸函数求最大

设有一组凸函数:f1(x),f2(x),,fm(x),则有:

g(x)=max{f1(x),f2(x),,fm(x)}

为凸函数。

3.5 凸集与凸函数的关系

讨论凸集和凸函数的两个工具:凸集上(镜)图Epigraph

3.5.1 水平集

任意一个函数(不一定是凸函数)f(x)水平集

La={xf(x)a,xC}

其中a为给定的水平值。

f(x)是凸函数,则其水平集均为凸集。反之,则不成立,即函数不是凸函数时,其水平集也可能是凸集。

3.5.2 上(镜)图Epigraph

函数f(x)的Epigraph定义为:

epi(f)={(x,y)Tf(x)y,xC}

f(x)epi(f)

小问题:给定非空闭凸集C,证明距离函数f(y)是凸函数,其中:

f(y)=min{||yx||2xC}

4 凸优化问题

4.1 凸优化问题通式

考虑最优化问题(P):

{ min f(x) s.t. gi(x)0, i=1,,mhi(x)=0, i=1,,l

记P的可行域为S={xRngi(x)0, i=1,,m,hi(x)=0, i=1,,l},则f(x),gi(x)是凸函数hi(x)是线性函数时,问题(P)称为凸优化问题

  • 为什么特别强调不等式约束条件gi(x)是凸函数呢?

首先,gi(x)0刻画的是水平值取0时的一个水平集;又知当函数为凸函数时,其水平集均为凸集合。

  • 为什么特别强调等式约束条件hi(x)是线性函数呢?

等式约束当为线性函数是,就相当于hi(x)=aTx+b=0,这种形式所刻画的集合是一个超平面,而超平面也是一个凸集合。

由以上两个小问题分析可知,在上面的条件下,由不等式约束和等式约束所刻画的集合S也是一个凸集合,这是凸优化问题的一个特点。

4.2 区分凸优化与非凸优化

区分凸优化与非凸优化是一个非常重要的事情,若是我们能够判断出该问题为凸优化问题,那么就能利用凸优化很多很好的性质进行求解分析问题。下面介绍凸优化问题的两个比较好的性质。

4.2.1 局部最优即全局最优

对于凸优化问题,其局部最优解就是全局最优解。

  • 局部最优解

设现在有一个问题可行解为x满足:f(x)f(x),xSNϵ(x)即在x很小的范围内的函数值都要大于x处的函数值,此时x为局部最优解。

  • 全局最优解

设现在有一个问题可行解为x满足:f(x)f(x),xS即在整个可行域范围内的函数值都要大于x处的函数值,此时x为全局最优解。

证明:

设对于凸优化,x是局部最优解,但不是全局最优,即存在x使得f(x)<f(x),xS,取λ(0,1),则有:

f(x+λ(xx))=f(λx+(1λ)x))λf(x)+(1λ)f(x)<f(x)

λ0时,(x+λ(xx))就非常趋近与x,即在x的邻域里面。那么就可以得出结论:凸优化的局部最优一定时全局最优,不然后产生矛盾。

4.2.2 凸优化问题最优性条件

最优性条件其实就是在讨论优化问题的最优解要满足的条件:充分条件、必要条件、充要条件。

xS为某一最优化问题的最优解,则等价于(充要条件):

f(x)T(xx)0,xS

证明——充分性:已知f(x)T(xx)0,xS,求证此时xS为某一最优化问题的最优解。

首先f(x)+f(x)T(xx)是一个经过(x,f(x))点的切平面,因为目标函数f是凸函数,则函数在其切平面的上方,即满足:

f(x)f(x)+f(x)T(xx)f(x),xS

即,对于任意x都有f(x)f(x),即xS为最优化问题的最优解。

证明——必要性:已知xS为某一最优化问题的最优解,求证f(x)T(xx)0,xS

(反证法):设存在xS使得f(x)T(xx)<0λ(0,1)

f(x+λ(xx))=f(x)+λf(x)(xx)+o(λ||xx)||)

整理可得:

f(x+λ(xx))f(x)λ=f(x)(xx)+o(λ||xx)||)λ

λ0时,o(λ||xx)||)λ0f(x)(xx)<0,则f(x)(xx)+o(λ||xx)||)λ<0,此时等式左边f(x+λ(xx))f(x)λ<0,即我们找到比f(x)函数值更小的,即与x是最优解矛盾。

几何解释:

xS

f(x)T(xx)0,xS

f(x)Txf(x)Tx,xS

α=f(x)

αTxαTx,xS

由上面的等价表达可知,若α0(f(x)0),则就找到了一个支撑超平面,该支撑超平面经过x,在该点处恰好支撑整个凸集合S

几类特殊凸问题的最优性条件:

  • 无约束凸优化minf(x) over Rnxf(x)=0

    • 根据前面的条件,可知:f(x)T(xx)0,由于没有约束条件,即(xx)可以取遍Rn中的所有向量,那么此时f(x)=0
  • 等式约束凸问题min{f(x)Ax=b}xμ,使f(x)+ATμ=0,Ax=b

    • 根据前面的条件,可知:f(x)T(xx)0,满足Ax=b,Ax=b,令向量d=xx,那么将满足等式约束的两个式子相减:A(xx)=Ad=0,即向量dA零空间中。又由于向量dA的零空间中,那么d同样在A的零空间中,因此向量dd都是f(x)T(xx)=f(x)Td0的解,也就是该不等式添加负号不等号不变方向,也就等价于f(x)T(xx)=f(x)Td=0。由于dA零空间中,而f(x)Td=0,所以f(x)TA的正交补空间中,也就是A的行空间,所以f(x)可以表示成AT的线性组合:

μ,使f(x)+ATμ=0,Ax=b

  • 这个就是KKT条件在本问题中的具体表现形式。

  • 非负约束凸优化min{f(x)x0}xf(x)ixi=0,x>0,f(x)0

    • 证明暂略,比较复杂,看视频吧

4.3 常见凸优化问题分类

4.3.1 线性规划 (Linear Programming, LP)

(一) 线性规划的标准形式

{ min cTx+d s.t.Gx=b,Hxe.

一言以蔽之,目标函数和约束条件都是仿射函数

注意,凸优化问题中很多形式可以通过转换变为标准形式的!!!如下面几种情况:

  • 线性分式规划
  • 最小化绝对值函数

min{|aTx+c|AX=b}

  • 最小化多面体函数

(二) 标准解法——单纯形法

单纯形法的基本思想是——基于线性规划的可行集是一个多面体,目标函数是线性的,绘制其等值面的时候是一组平行的线/面,找到多面体的支撑超平面。所以说,如果线性规划存在最优解,则可在极点(多面体的顶点)达到。

x是一个极点,则需判断x是否是最优解:

  • 若是最优解,则求解完成;
  • 若不是最优解,则需从x出发,找一个更优的极点。

详细参见:线性规划问题(LP问题)解决线性规划问题为什么要加入松弛变量?

4.3.2 凸二次规划 (Quadratic Programming, QP)

(一) 凸二次规划基本形式

{ min 12xTQx+cTx s.t.Ax=b,x0.

其中,Q0

(二) 标准解法——有效集法

后面讲解。

(三) 示例

  • 均值-方差模型
  • 最小二乘模型
4.3.3 带凸二次约束的二次规划(Quadraticlly Constrained Quadratic Program, QCQP)

(一) 基本形式

{ min 12xTQ0x+c0Tx s.t.12xTQix+ciTx+bi0, i=1,2,,kAxd.

其中,Qi0,i=0,1,,k.

4.3.4 二阶锥规划 (Second-Order Cone Program, SOCP)

(一) 基本形式

{ min fTx s.t.Aix+bi2ciTx+di, i=1,2,,kHxe.

k=0时,为LP问题;当所有ci=0时,为QCQP问题。

4.3.5 半定规划 (Semidefinite Program, SDP)

(一) 半定规划标准形式

{ min tr(CX) s.t.tr(QiX)=bi, i=1,2,,mx0.

其中,C,Qi均为对称矩阵。

转化为:线性矩阵不等式形式(LMI):

{ min cTx s.t.i=1nxiQiQ0Axb.

注意:若矩阵Q1Q2,则有Q2Q1是半正定矩阵。

4.3.6 几何规划 (Geometric Programming, GP)

(一) 例子:切比雪夫中心(集合中心)

  • 给定有界的集合C,xC的深度定义为:

depth(x,C)=dist(x,Rn(C))

可以理解为集合C中的点到集合C边界的距离。

  • 集合C的中心(chebyshev center)定义为具有最大深度的点:

xcenter(C)=argmaxxCdist(x,Rn(C))

  • 集合的中心即包含于该集合的最大球体的球心。

(二) 凸集合的中心问题为凸优化问题

(1) 假设S={xfi(x)0, i=1,,m},其中fi(x)是凸函数,寻找包含S的最大球体。

设该球体球心为x,半径为r,该球可以表示为:B={x+ruu21}

{ max   r s.t.supu21fi(x+ru)0, i=1,,m

注意:max/sup、min/inf辨析sup, inf 与 min, max

使用 inf 或 sup 总能保证一个函数的 inf 或 sup 存在,而函数的 min 或 max 有时候不存在。

(2) 多面体的中心:假设多面体P={xRnaiTxbi, i=1,,m},寻找包含P的最大球体,其球心即为集合P的中心。

通过题目,可将优化问题抽象如下:(球体可以表示为:B={x+ruu21})

{ max   r s.t.aiTx+ai2rbi, i=1,,m

(3) 椭球交集的中心:假设S={xRnxTAix+2biTx+ci0, i=1,,m},其中Ai0,寻找包含S的最大球体和球心。

通过问题描述,可将该问题建模为:

{maxr s.t. (Ai1rl(x+Ai1bi)rlλil0(x+Ai1bi)T0λici+biTAi1bi)0,

本问题涉及两个小知识点:

  • S-Procedure:

    • xTF1x+2b1Tx+c10xTF2x+2b2Tx+c20,当且仅当λ0使得(F1b1b1Tc1)(F2b2b2Tc2)0
  • Schur complement 对称分块矩阵:

    • X=(ABBTC),若A0,则X0当且仅当CBTA1B0

参考资料:

【1】为啥要知道一个对称方阵是否为各种定呢

【2】浅谈「正定矩阵」和「半正定矩阵」

【3】正定(positive definite)与半正定(semi-positive definite)

笔记参考资料:

【1】数值优化| 无约束最优性条件

【2】数值优化| 线搜索方法

【3】数值优化| 最速下降法与牛顿型方法

posted @   博客侦探  阅读(314)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 使用C#创建一个MCP客户端
· ollama系列1:轻松3步本地部署deepseek,普通电脑可用
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 按钮权限的设计及实现
点击右上角即可分享
微信分享提示