摘要: 本文参考韩家炜《数据挖掘-概念与技术》一书第六章,前提条件要理解 apriori算法。 另外一篇写得较好的文章在此推荐: http://hi.baidu.com/nefzpohtpndhovr/item/9d5c371ba2dbdc0ed1d66dca 0.实验数据集: user2items.csv 阅读全文
posted @ 2018-07-17 16:53 a-du 阅读(399) 评论(0) 推荐(0) 编辑
摘要: 频繁项集挖掘的应用多出现于购物篮分析,现介绍两种频繁项集的挖掘算法Aprior和FPGrowth,用以发现购物篮中出现频率较高的购物组合。 基础知识 项:“属性-值”对。比如啤酒2罐。 项集:项的集合。比如{啤酒2罐,…,尿布5片} K项集:项集中的每个项都有K个项。 支持度:项集在训练元组中同时出 阅读全文
posted @ 2018-07-17 16:27 a-du 阅读(1163) 评论(0) 推荐(0) 编辑
摘要: Apriori和fp-growth是频繁项集(frequent itemset mining)挖掘中的两个经典算法,虽然都是十几年前的,但是理解这两个算法对数据挖掘和学习算法都有很大好处。在理解这两个算法之前,应该先了解频繁项集挖掘是做什么用的。 频繁项集挖掘是关联规则挖掘中的首要的子任务。关联规则 阅读全文
posted @ 2018-07-17 16:21 a-du 阅读(2698) 评论(0) 推荐(0) 编辑