Apriori算法在Spark上的实现,K-频繁相机挖掘
摘要:
大家好,下面为大家分享的实战案例是K-频繁相机挖掘并行化算法。相信从事数据挖掘相关工作的同学对频繁项集的相关算法比较了解,这里我们用Apriori算法及其优化算法实现。首先说一下实验结果。对于2G,1800W条记录的数据,我们用了18秒就算完了1-8频繁项集的挖掘。应该还算不错。首先给出题目:本题的... 阅读全文
posted @ 2015-01-03 09:10 老杨的专栏 阅读(1328) 评论(1) 推荐(0) 编辑