斯坦福公开课《机器学习》第五章SVM笔记
![](https://app.yinxiang.com/shard/s63/res/e0df0721-6a94-4c22-9b68-c36555530ce7/1.png)
考虑训练样本里r hat的最小值,对应的是训练样本里函数间隔的最坏情形:
![](https://app.yinxiang.com/shard/s63/res/5e6738ba-84af-4d50-9a17-31102f00b6e7/2.png)
![](https://app.yinxiang.com/shard/s63/res/6c55f5eb-c74b-407c-a884-5b701b8fab02/3.png)
= r hat / || w ||
最优间隔分类器的定义:
![](https://app.yinxiang.com/shard/s63/res/42d08f5d-8fcc-4285-86b1-fa47dde6b4a0/4.png)
拉格朗日对偶性:略。
若要dual*=primary*=L(w*, α*, β*),w*, α*,β*满足KKT dual complementarity condition(KKT对偶互补条件):
![](https://app.yinxiang.com/shard/s63/res/026591ce-bd98-4d49-bebd-c610f3ea0eca/5.png)
优化间隔分类器:
考虑此分类器的定义,令:
![](https://app.yinxiang.com/shard/s63/res/3e19434f-a251-4a7f-9272-01bbdb6a49da/6.png)
则可得拉格朗日优化问题:
![](https://app.yinxiang.com/shard/s63/res/0877a106-8978-4686-9dc9-94441b62b45b/7.png)
对w, b求偏导数如下:
![](https://app.yinxiang.com/shard/s63/res/1a5fd493-5714-4ecc-9810-ec87417c8f3b/8.png)
![](https://app.yinxiang.com/shard/s63/res/a3ab8107-327a-46b3-8302-34699af1314a/11.png)
![](https://app.yinxiang.com/shard/s63/res/e1cbdac9-389d-4e40-b4bf-aae9b82054e0/12.png)
进而得到:
![](https://app.yinxiang.com/shard/s63/res/7e39239f-852a-482d-82ed-9bee2d94588f/2.png)
核函数:(未理解明白)
用核函数代替上式中的内积,将变量映射到更高维空间。这样计算内积就好,而不必把向量装入内存(事实上也装不下)。
![](https://app.yinxiang.com/shard/s63/res/bb808ab1-c597-4caf-9f06-a237536e2d80/1.png)
此式对应的 映射 为:
![](https://app.yinxiang.com/shard/s63/res/36a157fd-8da8-4135-bb43-8beab8289f1d/2.png)
高斯核:
![](https://app.yinxiang.com/shard/s63/res/ccac9f38-511b-434b-bbd8-8533817b2623/3.png)
![](https://app.yinxiang.com/shard/s63/res/48be6702-9075-45f4-848c-11dfe6be39fd/4.png)
即:K是一个valid的核 等价于 它所对应的核矩阵是对称半正定矩阵
在数据是非线性可分的情况下:
![](https://app.yinxiang.com/shard/s63/res/7197d0bb-eaa9-4d96-bb7f-c1b0da2f70e5/5.png)
称为 L1 norm soft margin SVM。是一个凸优化问题。
它允许间隔小于1,即允许有错误的分类。
SMO算法:
坐标上升算法:
![](https://app.yinxiang.com/shard/s63/res/7267ccc9-4adf-4c3d-968e-718a0c6ccc26/6.png)
这个算法的迭代次数比较多,但在某时某情况下如果W(a1,,,am)中的某个参数求最优值的代价非常小,那么内层循环将会非常快。
SMO:
![](https://app.yinxiang.com/shard/s63/res/af0e2b0f-3a92-44dc-80ef-ad6c1f4d2bc0/1.png)
如果像svm那样只对一个α求解,同时固定其他的α。由等式(19)得到
![](https://app.yinxiang.com/shard/s63/res/c4f906b1-d688-4339-9f4f-c19a6f3fa22f/2.png)
即α也就固定了。SMO同时对两个α求解,随即得到:
![](https://app.yinxiang.com/shard/s63/res/37e9bfd7-b3aa-472b-8929-d0a14044a3aa/3.png)
此式是一个一元二次函数,易得到α1。
Andrew Ng让在John Platt的论文里寻找下面两个问题的答案:
![](https://app.yinxiang.com/shard/s63/res/ba2de0f8-4a72-4944-9f6c-d1dbdafd9733/1.png)
SMO算法:
由等式![](//img-blog.csdn.net/20160512203154645?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
可知问题转化为求α的问题,如下:
此等式中各个参数的求解如下:
ps:不知不觉好久不写笔记。