SVM基础

SVMs是对数据分类一种有用的技术。尽管sVM被认为比神经网络容易点,而用户由于不熟悉SVM,在开始时经常得到不理想的结果。

我们的目的是让初学者获得可接受的结果。

尽管用户无需理解SVM的基础理论,但简单的介绍这些必要的基础对于我们实际操作是必要的。一个分类工作常常把数据分为训练集和测试集。训练集中每个样本都包含一个“目标值”和一些属性值。SVM的目标就是产生一个模型(基于训练数据),这个模型将预测测试数据的目标值,当然仅由测试数据的属性值决定。

给出一个训练集的实例(Xi,Yi),i=1...l;Xi属于Rn,y属于(-1,1),

SVM要求下面优化问题的解决方案:

这里训练向量Xi通过函数被映射到更高(可能是无限)维空间。SVM在高维空间找到一个具有最大距离的线性超平面。

C>0是误差项的惩罚因子。另外,被称为核函数。尽管新的核函数被研究者不断提出,但初学者可以在SVM书籍中找到下面四个核函数:

这里,,r和d是核函数参数。

第一篇先翻译这么多吧,接下来再翻译点核函数,发现网上很多关于核函数的介绍都是转来转去,真正经典的还是一些外文的介绍吧!

posted @ 2011-12-04 08:33  hailong  阅读(722)  评论(0编辑  收藏  举报