机器学习技法(5)--Kernel Logistic Regression

回顾一下soft margin SVM的知识:

然而从另一个角度来看,分为真的有犯错和没有犯错:

在没有犯错的时候,ξn=0就好了。于是ξn就可以写成一个求max的过程。根据这个思路,我们有了SVM的新形式:

这样一来,ξn就不再是一个独立的变量,它变成了一个由b和w决定的变量,这样的话,式子又被简化了。

简化后的式子和L2的正则差不多:

SVM和正则化有很多相似的点:

这些联系可以帮助我们以后换一种视角看待SVM。

下面从错误衡量的视角看LR和SVM:

由此可以看出SVM≈L2的LR。

那么再比较一下他们在二分类问题时的优缺点:

LR做二元分类比较好,因为它有个几率的概念;SVM只有固定的解,但是它有kernel这个好武器。

先跑个SVM,得到b和w;

再做一些放缩和平移的处理。

得到新的问题:

具体的步骤:

kernel的本质其实就是w可以表示成输入数据的线性组合。那么如果用这样的思路去看L2正则:

上图证明了L2正则也可以被kernel的(kernelized)。接下来就可以继续证明LR也可以被kernel:

总结:

 

posted @ 2016-09-29 22:26  cyoutetsu  阅读(318)  评论(0编辑  收藏  举报