SVM支持向量机分类

一、SVM目标和原理

svm分为线性可分和线性不可分两种

线性可分: 

  svm.SVC(C=0.8, kernel='linear', class_weight={-1:1, 1:20})

线性不可分: 使用径向基(高斯)核函数

  svm.SVC(C=0.8, kernel='rbf', class_weight={-1: 1, 1: 10})

目标函数:所有样本点到所有可能分界线最小值中的最大值即为目标函数 

       找到目标函数之前首先要找到支撑向量。分界线L1具有无数条,需要在可行范围内使得D的值达到最大

    

 

二、SVM损失

  svm分类器即便分类是正确的的也会存在损失,其损失是在支撑向量和切分线之前的样本 距离切分线的距离  

    

三、SVM参数

  C值越大支撑向量距离切分线的距离越近,C值越小支撑向量距离切分线的距离越远

  gamma 是高斯分布的一个参数,可以理解为其最大直径的 大小 

四、适合场景

  svm的训练效果和泛华是比较好的但是训练的时间长,适合处理特征少量或者中等的数据,特征多的可以选择logistics回归

 

posted on 2019-04-22 20:06  本名边境  阅读(674)  评论(0编辑  收藏  举报

导航