svm支持向量机分类方法
SVM支持向量机,作为一种分类方法,通过核函数将低维空间上线性不可分的样本映射到高维空间上线性可分的样本空间,通过核函数计算内积,得到一个线性分类器。
常用的核函数有多种,如线性核函数,多项式核函数,径向基核函数,Sigmoid核函数和复合核函数。libsvm用的是线性核函数,核函数的选取对分类器的性能有一定影响。
分类中的概念,如超平面(分类器构成的平面)、支撑向量、松弛向量、离散点、软间隔分类(加入松弛向量,可以容易离散点,容忍度可以通过参数调整)、硬间隔分类(没有松弛向量)、样本不均衡时会影响超平面的选择(欺负样本体积较小的类别,通过调整不同的松弛向量(可根据样本大小比例或体积比例),样本集较少的容忍度小)。
SVM应用于多分类时,是通过一对多或一对一等组合成多个分类器,然后通过投票或DAG SVM(类似于二分的思想)进行分类。
SVM训练过程的事件复杂度与样本数量,样本维数及支撑向量的个数有关。
推荐阅读SVM入门系列(一至十):http://www.blogjava.net/zhenandaci/archive/2013/01/17/254519.html#394361
记下来,整理一下思路,便于日后温故而知新。