吕吕吕吕吕

2016年6月5日

摘要：作为一个机器学习入门级选手，写这篇是抱着很大的谨慎态度的，svm的确是涉及到较多数学知识的一章，不甚好理解。此篇仅作为给自己的一个学习记录。依然按惯例，svm的原生方法解决的分类问题，以二分类为例。我们现在有很多条样本数据，类别标签属于两类，一类是正例，一类是负例。svm的核心想法是找到一个间隔最阅读全文

posted @ 2016-06-05 21:08 吕吕吕吕吕阅读(187) 评论(0) 推荐(0) 编辑

2016年6月4日

naive bayes & knn

摘要： 1、朴素贝叶斯方法，首先要明确是用于分类任务。在机器学习中，但凡遇到分类问题，所有的方法都关注两部分，即：待分类输入向量的特征和训练向量集中的每个类别的特征。变量不过就是，特征数的多少，类别的多少，训练样本的多少。朴素贝叶斯方法在处理这个问题时，采用的思路是概率化的，即每一个输入向量既可能属于阅读全文

posted @ 2016-06-04 20:16 吕吕吕吕吕阅读(531) 评论(0) 推荐(0) 编辑

2016年5月27日

“ML_for_Hackers”[2]

摘要：今天在处理文本回归时，遇到一个问题，需要记录。如果没有标记的一句代码，会报错：这是stackoverflow上的解决： It seems this would have worked just fine in tm 0.5.10 but changes in tm 0.6.0 seems to 阅读全文

posted @ 2016-05-27 22:10 吕吕吕吕吕阅读(623) 评论(0) 推荐(0) 编辑

2016年5月26日

“ML_for_Hackers”[1]

摘要：今天主要内容是线性回归的介绍原则：在进行任何正式分析之前，先要对数据进行可视化分析，看看直观效果。当没有任何其他附加信息的情况下，对一个变量的最佳假设也是最基本的假设，就是其均值。（前提是使用平方误差作为衡量准则时）第二层信息就是可以被利用的二元或多元区分型的信息，这类信息可以辅助我们的预测。阅读全文

posted @ 2016-05-26 22:51 吕吕吕吕吕阅读(215) 评论(0) 推荐(0) 编辑

公告