午夜的风

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2016年1月14日

摘要: 首先简单描述一下Apriori算法:Apriori算法分为频繁项集的产生和规则的产生。Apriori算法频繁项集的产生:令ck为候选k-项集的集合,而Fk为频繁k-项集的集合.1.首先通过单遍扫描数据集,确定每个项的支持度。一旦完成这一步,就可以得到所有频繁1-项集的集合F12.接下来,该算法将使用... 阅读全文
posted @ 2016-01-14 14:05 hard-working 阅读(363) 评论(0) 推荐(0) 编辑

摘要: 由于刚刚进入研究生阶段,通过几个月对大数据的学习,从java到hadoop,再到scala到spark。在这我写一下我在ubuntu系统下intelliJ IDEA的安装和配置。首先我的ubuntu系统是14.04的,hadoop-2.6.0,java-1.7.0,scala-2.10.5在配置in... 阅读全文
posted @ 2016-01-14 01:32 hard-working 阅读(25366) 评论(0) 推荐(0) 编辑