05 2018 档案
摘要:SVM 和线性分类器是分不开的。因为SVM的核心:高维空间中,在线性可分(如果线性不可分那么就使用核函数转换为更高维从而变的线性可分)的数据集中寻找一个最优的超平面将数据集分隔开来。 所以要理解SVM首先要明白的就是线性可分和线性分类器。 可以先解释这张图,通过这张图就可以了解线性分类器了。 这是一
阅读全文
摘要:上一篇说到SVM需要求出一个最小的||w|| 以得到最大的几何间隔。 求一个最小的||w|| 我们通常使用 来代替||w||,我们去求解 ||w||2 的最小值。然后在这里我们还忽略了一个条件,那就是约束条件,在上一篇的公式(8)中的不等式就是n维空间中数据点的约束条件。只有在满足这个条件下,求解|
阅读全文
摘要:前言: 经历过文本的特征提取,使用LibSvm工具包进行了测试,Svm算法的效果还是很好的。于是开始逐一的去了解SVM的原理。 SVM 是在建立在结构风险最小化和VC维理论的基础上。所以这篇只介绍关于SVM的理论基础。 目录: 文本分类学习(一)开篇 文本分类学习(二)文本表示 文本分类学习(三)特
阅读全文
摘要:直接从特征提取,跳到了BoostSVM,是因为自己一直在写程序,分析垃圾文本,和思考文本分类用于识别垃圾文本的短处。自己学习文本分类就是为了识别垃圾文本。 中间的博客待自己研究透彻后再补上吧。 因为获取垃圾文本的时候,发现垃圾文本不是简单的垃圾文本,它们具有多个特性: 1. 种类繁多,难有共同的特征
阅读全文