摘要:
首先简单描述一下Apriori算法:Apriori算法分为频繁项集的产生和规则的产生。Apriori算法频繁项集的产生:令ck为候选k-项集的集合,而Fk为频繁k-项集的集合.1.首先通过单遍扫描数据集,确定每个项的支持度。一旦完成这一步,就可以得到所有频繁1-项集的集合F12.接下来,该算法将使用... 阅读全文
摘要:
首先简单描述一下Apriori算法:Apriori算法分为频繁项集的产生和规则的产生。Apriori算法频繁项集的产生:令ck为候选k-项集的集合,而Fk为频繁k-项集的集合.1.首先通过单遍扫描数据集,确定每个项的支持度。一旦完成这一步,就可以得到所有频繁1-项集的集合F12.接下来,该算法将使用... 阅读全文
摘要:
由于刚刚进入研究生阶段,通过几个月对大数据的学习,从java到hadoop,再到scala到spark。在这我写一下我在ubuntu系统下intelliJ IDEA的安装和配置。首先我的ubuntu系统是14.04的,hadoop-2.6.0,java-1.7.0,scala-2.10.5在配置in... 阅读全文
|