摘要: 1 Apriori介绍 Apriori算法使用频繁项集的先验知识,使用一种称作逐层搜索的迭代方法,k项集用于探索(k+1)项集。首先,通过扫描事务(交易)记录,找出所有的频繁1项集,该集合记做L1,然后利用L1找频繁2项集的集合L2,L2找L3,如此下去,直到不能再找到任何频繁k项集。最后... 阅读全文
posted @ 2014-02-17 15:42 唐僧吃肉 阅读(9192) 评论(0) 推荐(0) 编辑
摘要: 摘要: Apriori算法是产生k项高频项目组的一般手段。算法概要:首先产生k项高频项目集合Lk,自身链接形成k+1项的项目结合C(k+1),然后剪枝(去掉以前去掉的不满足支持度的高频),生成K=1项高频项目集合L(k+1) 1 早些时候写过关于购物篮分析的文章,其中提到了C5.0和... 阅读全文
posted @ 2014-02-17 15:14 唐僧吃肉 阅读(616) 评论(0) 推荐(0) 编辑
摘要: 1 同步停止,报错误: Could not find first log file name in binary log index file 数据库主从出错: Slave_IO_Running: No 一方面原因是因为网络通信的问题也有可能是日志读取错误的问题。以下是日... 阅读全文
posted @ 2014-02-17 14:07 唐僧吃肉 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 关联规则 关联规则是形如X→Y的蕴涵式,其中, X和Y分别称为关联规则的先导(antecedent或left-hand-side, LHS)和后继(consequent或right-hand-side, RHS) 事 故事 在描述有关关联规则的一些细节之前,先来看... 阅读全文
posted @ 2014-02-17 11:31 唐僧吃肉 阅读(1149) 评论(0) 推荐(0) 编辑
摘要: 机器学习与数据挖掘中的十大经典算法 背景: top10算法的前期背景是吴教授在香港做了一个关于数据挖掘top10挑战的一个报告,会后有一名内地的教授提出了一个类似的想法。吴教授觉得非常好,开始着手解决这个事情。找了一系列的大牛(都是数据挖掘的大牛),都觉得想法很好,但是都不愿自己干。原因估... 阅读全文
posted @ 2014-02-17 11:04 唐僧吃肉 阅读(716) 评论(0) 推荐(0) 编辑