摘要: 作为一个机器学习入门级选手,写这篇是抱着很大的谨慎态度的,svm的确是涉及到较多数学知识的一章,不甚好理解。此篇仅作为给自己的一个学习记录。 依然按惯例,svm的原生方法解决的分类问题,以二分类为例。我们现在有很多条样本数据,类别标签属于两类,一类是正例,一类是负例。svm的核心想法是找到一个间隔最 阅读全文
posted @ 2016-06-05 21:08 吕吕吕吕吕 阅读(187) 评论(0) 推荐(0) 编辑
摘要: 1、朴素贝叶斯方法,首先要明确是用于分类任务。 在机器学习中,但凡遇到分类问题,所有的方法都关注两部分,即:待分类输入向量的特征和训练向量集中的每个类别的特征。 变量不过就是,特征数的多少,类别的多少,训练样本的多少。 朴素贝叶斯方法在处理这个问题时,采用的思路是概率化的,即每一个输入向量既可能属于 阅读全文
posted @ 2016-06-04 20:16 吕吕吕吕吕 阅读(531) 评论(0) 推荐(0) 编辑
摘要: 今天在处理文本回归时,遇到一个问题,需要记录。 如果没有标记的一句代码,会报错: 这是stackoverflow上的解决: It seems this would have worked just fine in tm 0.5.10 but changes in tm 0.6.0 seems to 阅读全文
posted @ 2016-05-27 22:10 吕吕吕吕吕 阅读(623) 评论(0) 推荐(0) 编辑
摘要: 今天主要内容是线性回归的介绍 原则:在进行任何正式分析之前,先要对数据进行可视化分析,看看直观效果。 当没有任何其他附加信息的情况下,对一个变量的最佳假设也是最基本的假设,就是其均值。(前提是使用平方误差作为衡量准则时) 第二层信息就是可以被利用的二元或多元区分型的信息,这类信息可以辅助我们的预测。 阅读全文
posted @ 2016-05-26 22:51 吕吕吕吕吕 阅读(215) 评论(0) 推荐(0) 编辑