SVM和logistic regression的一些对比
一、SVM的常用目标函数形式
soft margin svm可表示为:
其中,C表示惩罚系数;C越大,表示对margin越严格,即对不满足约束的样本数要更少;
反之,C越小,表示对margin越宽松,即可接受不满足约束的样本数越多。
例如下图所示:
二、SVM和logistic regression的对比
1、对于SVM目标函数的解读
SVM的目标函数与带了L2正则的Model的目标函数很相似,并且具有相同的一些性质。
2、三种常用替代损失函数对比
因此,SVM目标函数中的max(1-ys,0)函数与Logistic regression的目标函数很像;如果给LR加入L2正则化,那么有:
三、Probabilistic SVM的实现思路
1、鉴于SVM和加L2正则的LR model很相似出发:
(1)idea1
将soft margin的SVM进行求解,将得到的w,b参数当作LR model的w',b'的近似解,然后使用sigmoid函数进行概率求解。
优点:直接使用了svm和LR的相似性,实际使用上,较为简单,通常表现还不错。
缺点:实际上几乎丧失了LR model推导中的maximum likelyhood等性质。
(2)idea2
将soft margin的SVM进行求解,将得到的w,b参数当作LR model解的起始点,再进行LR模型的求解。
缺点:效果和单独使用LR model求解差不多,并且对于kernel svm,则无法使用LR model进行近似。
2、采用融合SVM和LR各自优势的思路
(1) 做法
将SVM求解出来的结果(即求解出w和b)后计算(wx+b)的值value,然后在value上加上两个自由度的操作,即放缩操作A,平移操作B;在A和B两个参数上使用logistic regression进行训练(实际上是把A和B分别当作LR model里的w和b参数来求解),这样可以比较吻合在logistic regression中的maximum likelyhood的需求。
优点:保留了svm原有的性质,包括kernel svm的性质;可以使用LR model获得概率值表示。
几何解释:用SVM 找出分类超平面的法向量,然后不改变法向量,但是在法向量之上再加上一些放缩和平移操作,使其更吻合在logistic regression中的maximum likelyhood的需求。
(2) Probabilistic SVM的目标函数:
(3)Probabilistic SVM一般化的求解步骤