支持向量机
支持向量机从线性可分情况下的最优分类面发展而来。
思想
分类:寻找类间的分类平面,使得类到该分类平面的距离尽可能大,即分类平面两侧的空白区域尽可能大。
映射:通常样本数据线性不可分,可以应用固定的非线性映射(核函数)将数据映射到高维空间中,在高维空间中的线性分类等价于原始空间中的非线性分类;在高维空间中计算映射后数据的内积如同在原始数据中计算内积一样。
- 核函数:线性核、多项式核、高斯核、Sigmoid核
训练
支持向量机的学习问题可以形式化为求解具有全局最优解的凸二次规划问题,有许多方法可以求解这一问题,但当训练样本容量大时,效率低。
==>SMO(序列最小优化)算法