拉格朗日对偶
对于在的约束下最小化的问题(并不要求convex),我们有Lagrange函数。处的KKT条件可以简洁地描述为,,,其中。
我们注意到可行中始终满足Lagrang函数是的下界,因为可行域中始终成立,而,因此。而又有。所以本质上就是的最大值:。于是最优解就可以表示为。
一般情况下,和的顺序是不能交换的。事实上任何时候我们都有以下min-max不等式:,也就是说先求关于某变量的最大值再求另一变量的最小值总是能得到一个更大的结果。因为对于任意的,,右侧是一个定值,因此当对取时也成立,这样就得到了min-max不等式。这一事实不是出乎意料的,因为我们早已接触过类似问题。例如,在研究数列极限时我们证明过上极限始终大于等于下极限,而上极限和下极限本身就可以用min-max来定义。
所以对于,我们有。记,就有,简写为。这就是最优化问题的对偶性!称为原问题的Lagrange对偶函数,称为原问题的对偶问题。注意这不仅仅在convex时成立,而是对于任何带等式和不等式约束的最优化问题中成立。如果原问题恰好是线性规划问题,它的对偶问题恰好就是我们之前得到的线性规划的对偶规划。
线性规划是具有强对偶性的,也即对偶规划和原问题取到相同的极值,gap为0。现在我们看到对于任何一般的最优化问题,都有,也即弱对偶性对一般的最优化问题是恒成立的。那么我们自然要追问,满足什么条件时一般的最优化问题也有强对偶性?下面的定理告诉我们对于凸优化问题而言,如果在处KKT条件成立(这意味着是最优解,并且有乘子存在),那么强对偶性成立,同时恰好是对偶问题的最优解。为此,我们只需要说明存在使得成立。对于我们根据KKT条件得到的,,而在凸优化问题中是凸函数,是仿射函数,因此关于是凸函数,而根据KKT条件,因此就是的极小值点,而恰好,因此。(反过来,如果强凸成立,并且原问题和对偶问题都有有限最优解,记为和,那么可以验证在原问题中满足KKT条件。)
引入对偶的一个重要原因就在于,对偶问题相较于原问题而言往往更容易求解。例如,任何优化问题(不一定convex)的对偶问题中,Lagrang对偶函数一定是concave的,这意味着哪怕一个不是凸优化问题的对偶问题也总是一个凸优化问题!这是因为是关于的仿射函数,仿射函数既是convex的又是concave的。定义为了关于逐点求最小值,我们证明过一列concave函数(不要求可数)逐点求最小值后得到的函数依然是concave的,因此一定是concave函数。
另外我们注意到并不是所有凸优化问题都有强对偶性成立的(在上面的充分条件中我们还要求KKT条件成立),考虑在的约束下求的最小值,它的结果是1;而它的对偶问题得到的结果却是0。这个反例反映出了凸优化问题在边界上的一些效应,这导致强对偶性失效了。只要我们弥补上边界的情况,就能得到下面这个一般的结论(Slater's Condition):对于凸优化问题,如果在函数的定义域内存在一个“相对内点(relative interior points, 'relint')”使得成立,那么强对偶性成立。其中,相对内点是相较于一般讨论的内点做出的一点修正,一般的内点要求存在一个整个的球状小邻域都落在定义域内,而这里只要求把球状小邻域对原定义域的仿射空间求交后落在定义域内,例如在空间中,一条线段的相对内点就是除了端点的所有点,一个圆盘的相对内点就是除了圆周上的所有点。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾(3.3-3.9)
· AI 智能体引爆开源社区「GitHub 热点速览」
· 写一个简单的SQL生成工具