拉格朗日乘子法最小值转化为对偶函数最大值问题在SVM部分有很重要的作用,今天详细听了邹博老师凸优化课程关于这部分的讲解,做一个小小的总结。
一、知识铺垫
1. 保凸算子
凸函数的非负加权和 :
凸函数与仿射函数的复合:
凸函数的逐点最大值、逐点上确界:
第一个和第二个直接使用定义还是挺简单的,因为后边也要用到,这里给出第三个的证明:
第二个不等式直观上来看:
得到一个后边需要用的结论:几个凸函数逐个取大得到的函数任然是凸函数,几个凸函数逐个取小得到的函数是凹函数。取几个凸函数为直线,得到下边这样的一个示意图。
二、凸优化问题的定义
若fi(x)为凸函数,hj(x)为仿射函数,则为一个凸优化问题。
凸优化问题的可行域为凸集,凸优化问题的局部最优解即为全局最优解。
三、凸优化问题的对偶问题
3.1 基本分析
我们可以知道,对偶函数为一个凹函数,一定存在最大值。(之前证明过,几个凸函数的min为凹函数)
对偶函数的最大值一定小于等于原函数的最小值,那么求原函数的最小值是否就可以转化为对偶函数的最大值呢?我们使用这样一个图来分析:
如图,下边的虚线部分表示了一个凸函数f1(x),假设lambda1 = 0,那么没有影响,原函数最小值大概为1.35,但是随着lambda1的初步增大,最小值点会往上移动,对应于我们的原函数上面的虚线。但是lambda1继续增大的时候,最小值点变了,所以最小值点又开始下降了。最终得到如右边所示的一个最小值关于lambda1的变化趋势图。
由以上分析可知,原问题的最小值可以转化为对偶问题的最大值问题。(第二项最大值为0,第三项就是0)
3.2鞍点解释
3.3强对偶条件