支持向量机
已经花了好多时间看支持向量机了,就是一直没开始写,网再渣,我也要开始总结了
支持向量机(SVM)
一种二类分类模型。基本模型是定义在特征空间上的间隔最大的线性分类器,学习策略就是间隔最大化,最终是求解凸二次规划的最优化算法。
包含线性可分支持向量机、线性支持向量机、非线性支持向量机。
线性可分支持向量机与硬间隔最大化
考虑二类分类问题,数据用向量x表示,类别为y(-1,1)一个线性分类器的学习目标就是要在n维的数据空间中找到一个分类超平面,其方程可以表示为:
ps:w为法向量,b为截距
对应的分类决策函数f(x)表示如下:
f(x)即为线性可分支持向量机,sign(x)为符号函数,x>0 为1,x<0 为-1,x=0为0
函数间隔与几何间隔
对于A、B、C三个点,距离超平面越远,可信度越高,从而引出函数间隔的概念。
函数间隔:对于给定的训练集T以及超平面(w,b),定义超平面(w,b)关于样本点(xi,yi)的函数间隔为