解密SVM系列（二）：SVM的理论基础(转载)

上节我们探讨了关于拉格朗日乘子和KKT条件，这为后面SVM求解奠定基础，本节希望通俗的细说一下原理部分。

一个简单的二分类问题如下图：
这里写图片描述
我们希望找到一个决策面使得两类分开，这个决策面一般表示就是

这里我们把问题反过来看，假设我们知道了结果，就是上面这样的分类线对应的权值W和b。那么我们会看到，在这两个类里面，是不是总能找到离这个线最近的点，向下面这样：
这里写图片描述
然后定义一下离这个线最近的点到这个分界面（线）的距离分别为d1,d2。那么SVM找最优权值的策略就是，先找到最边上的点，再找到这两个距离之和D，然后求解D的最大值，想想如果按照这个策略是不是可以实现最优分类，是的。好了还是假设找到了这样一个分界面

好了再看看D=d1+d2怎么求吧，假设分界面

这里W=(w1,w2)，是个向量，||W||为向量的距离，那么

我们知道，如果一个一次函数分界面为

m i n

把约束条件换成小于号的形式：

好了那样的话就可以引入拉格朗日乘子法了，优化的目标变为：

L (w, b, α) = 1 2 w T w + α 1 h 1 ( x ) + . . . + α n h n ( x )

\partial L \partial w = w - \sum i = 1 N α i y i x i = 0 \Rightarrow w = \sum i = 1 N

好了得到上面的两个公式，再带回L中把去w和b消掉，你又可能发现，w确实可以消，因为有等式关系，那b怎么办？上述对b求导的结果竟然不含有b，上天在开玩笑吗？其实没有，虽然没有b，但是有那个求和为0呀，带进去你会惊人的发现，b还真的可以消掉，就是因为了那个等式。简单带下：

W (α) = L (w, b, α) = 1 2 ( \sum i = 1 N α i y i x i ) T ( \sum

m a x

细心的你肯可能会发现，上述所有的构造等等都是在数据完全线性可分，且分界面完全将两类分开，那么如果出现了下面这种情况：
这里写图片描述
正负两类的最远点没有明显的分解面，搞不好正类的最远点反而会跑到负类里面去了，负类最远点跑到正类里面去了，要是这样的话，你的分界面都找不到，因为你不可能找到将它们完全分开的分界面，那么这些点在实际情况是有的，就是一些离群点或者噪声点，因为这一些点导致整个系统用不了。当然如果不做任何处理确实用不了，但是我们处理一下就可以用了。SVM考虑到这种情况，所以在上下分界面上加入松弛变量

好了那么因为松弛变量的加入，导致每个点的约束条件就变化了点，像上界面以上的点，它满足的条件可能就是：

m i n

L (x, α, β) = 1 2 W T W - \sum i = 1 N α i ( y i ( W x i + b ) + ϵ i

\partial L \partial w = w - \sum i = 1 N α i y i x i = 0 \Rightarrow w = \sum i = 1 N

W (α) = - 1 2 ( \sum i , j = 1 N α i y i α j y j x i * x j ) +

W (α) = - 1 2 ( \sum i , j = 1 N α i y i α j y j x i * x j ) +

剩下的问题是怎么去找这样一组最优解

posted @ 2018-01-31 16:39 Vae永Silence 阅读(626) 评论(0) 编辑收藏举报

刷新页面返回顶部

Vae永Silence

解密SVM系列（二）：SVM的理论基础(转载)

公告