支持向量机（SVM）课前准备（二）--KKT条件

Karush–Kuhn–Tucker conditions

我先直接给出公式（别跑！），然后慢慢解释每一条内容，欢迎批评指正！

我们优化的目标是：

其中，KKT条件如下：

公式1、2、3不多解释。

公式4、5，通过一个简单例子说明：

g_i添加一个 ≥0 的松弛变量、。得到

由此，我们将不等式转化为等式约束，应用拉格朗日乘子法。

拉格朗日方程如下：

对方程求偏导如下：

注意红笔写的条件，我们会稍后解释。

那么现在开始解方程组

首先考虑式5，

当u₁=0，a₁≠0时，即 g₁ 对f(x)无约束

当u₁≠0，a₁=0时，即 g₁ 对f(x)有约束，且根据式3可知， g₁ 也等于0。

式6同理。注意，不等式对f(x)有约束效果时，不等式等于零。

此时，方程组简化成

推广，对于多个不等式约束，有　

上述不等式称之为KKT条件，与本文一开始略有不同的是没有了等式的约束（不用在此纠结，我们关心的是不等式的约束问题），其中u_j称之为KKT乘子

最后利用几何的角度说明，为什么在极值点处KKT乘子大于等于零？

其实用一个不等式约束很好理解，类似拉格朗日乘子法，

f(x)的负梯度与g(x)的梯度同向，所以u1≥0.

现增加一个不等式约束。

将式1用梯度表示并移项，

x*表示极值点。

那么，此时f(x)的负梯度可以表示成所有有效约束条件在该点梯度的线性组合，梯度为向量，且与等高线垂直，有效指的是该约束条件（不等式）对应的KKT乘子。

如图，极值点X_K一定落在g₁(X)=0和g₂(X)=0两平面的交线上，且点X_K处f(x)的负梯度可以为g₁(X)和g₂(X)梯度的线性组合。考虑两种情况：

注意，由于约束条件为不等式，所以极值点的可行域为下半平面。

当在b情况时，（u_i小于0）在可行域C值可以变化，所以这种情况极值点不是最优。如图

在a情况下，u_i≥≥0，当C发生变化时，约束条件破坏，即该点为局部最优点。

接下一节感知机

最后附一个拉格朗日对偶问题讲的很好的博文

posted on 2019-05-05 10:46 be·freedom 阅读(2172) 评论(0) 编辑收藏举报