K-频繁项集挖掘并行化算法(Apriori算法在Spark上的实现)
摘要:
大家好,下面为大家分享的实战案例是K-频繁相机挖掘并行化算法。相信从事数据挖掘相关工作的同学对频繁项集的相关算法比较了解,这里我们用Apriori算法及其优化算法实现。首先说一下实验结果。对于2G,1800W条记录的数据,我们用了18秒就算完了1-8频繁项集的挖掘。应该还算不错。给出题目:本题的较第... 阅读全文
posted @ 2015-01-02 14:27 老杨的专栏 阅读(5181) 评论(4) 推荐(1) 编辑