会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
datahunter
关注机器学习与数据挖掘
博客园
首页
新随笔
联系
订阅
管理
2014年9月13日
Mahout源码分析:并行化FP-Growth算法
摘要: FP-Growth是一种常被用来进行关联分析,挖掘频繁项的算法。与Aprior算法相比,FP-Growth算法采用前缀树的形式来表征数据,减少了扫描事务数据库的次数,通过递归地生成条件FP-tree来挖掘频繁项。参考资料[1]详细分析了这一过程。事实上,面对大数据量时,FP-Growth算法生成...
阅读全文
posted @ 2014-09-13 14:35 Mark Lin
阅读(3832)
评论(4)
推荐(1)
编辑