摘要: 【数据挖掘】分类之kNN 1.算法简介 kNN的思想很简单:计算待分类的数据点与训练集所有样本点,取距离最近的k个样本;统计这k个样本的类别数量;根据多数表决方案,取数量最多的那一类作为待测样本的类别。距离度量可采用Euclidean distance,Manhattan distance和cosi 阅读全文
posted @ 2017-08-09 17:17 Vae永Silence 阅读(276) 评论(0) 推荐(0) 编辑
摘要: 【数据挖掘】聚类之k-means 1.算法简述 分类是指分类器(classifier)根据已标注类别的训练集,通过训练可以对未知类别的样本进行分类。分类被称为监督学习(supervised learning)。如果训练集的样本没有标注类别,那么就需要用到聚类。聚类是把相似的样本聚成一类,这种相似性通 阅读全文
posted @ 2017-08-09 17:16 Vae永Silence 阅读(361) 评论(0) 推荐(0) 编辑
摘要: 【数据挖掘】分类之decision tree、 1. ID3 算法 ID3 算法是一种典型的决策树(decision tree)算法,C4.5, CART都是在其基础上发展而来。决策树的叶子节点表示类标号,非叶子节点作为属性测试条件。从树的根节点开始,将测试条件用于检验记录,根据测试结果选择恰当的分 阅读全文
posted @ 2017-08-09 17:14 Vae永Silence 阅读(293) 评论(0) 推荐(0) 编辑
摘要: 【数据挖掘】分类之Naïve Bayes 1.算法简介 朴素贝叶斯(Naive Bayes)是监督学习的一种常用算法,易于实现,没有迭代,并有坚实的数学理论(即贝叶斯定理)作为支撑。 本文以拼写检查作为例子,讲解Naive Bayes分类器是如何实现的。对于用户输入的一个单词(words),拼写检查 阅读全文
posted @ 2017-08-09 17:13 Vae永Silence 阅读(256) 评论(0) 推荐(0) 编辑
摘要: 【数据挖掘】关联分析之Apriori 1.Apriori算法 如果一个事务中有X,则该事务中则很有可能有Y,写成关联规则 {X}→{Y} 将这种找出项目之间联系的方法叫做关联分析。关联分析中最有名的问题是购物蓝问题,在超市购物时,有一个奇特的现象——顾客在买完尿布之后通常会买啤酒,即{尿布}→{啤酒 阅读全文
posted @ 2017-08-09 17:10 Vae永Silence 阅读(367) 评论(0) 推荐(0) 编辑
摘要: 大概花了将近2个月的时间,自己把18大数据挖掘的经典算法进行了学习并且进行了代码实现,涉及到了决策分类,聚类,链接挖掘,关联挖掘,模式挖掘等等方面。也算是对数据挖掘领域的小小入门了吧。下面就做个小小的总结,后面都是我自己相应算法的博文链接,希望能够帮助大家学习。 1.C4.5算法。C4.5算法与ID 阅读全文
posted @ 2017-08-09 17:05 Vae永Silence 阅读(269) 评论(0) 推荐(0) 编辑
摘要: python3英文视频教程(全87集) http://pan.baidu.com/s/1dDnGBvV python从入门到精通视频(全60集)链接:http://pan.baidu.com/s/1eQw2dd4 密码:9bdl python学习手册视频教程(全44集) http://pan.bai 阅读全文
posted @ 2017-08-09 16:36 Vae永Silence 阅读(324) 评论(0) 推荐(0) 编辑