摘要: 二.Apriori算法 上文说到,大多数关联规则挖掘算法通常采用的策略是分解为两步: 频繁项集产生,其目标是发现满足具有最小支持度阈值的所有项集,称为频繁项集(frequent itemset)。 规则产生,其目标是从上一步得到的频繁项集中提取高置信度的规则,称为强规则(strong rule)。通 阅读全文
posted @ 2017-12-11 11:43 yuanninesuns 阅读(1186) 评论(0) 推荐(0) 编辑
摘要: 一.基本概念 我们来看上面的事务库,如同上表所示的二维数据集就是一个购物篮事务库。该事物库记录的是顾客购买商品的行为。这里的TID表示一次购买行为的编号,items表示顾客购买了哪些商品。 事务: 事务库中的每一条记录被称为一笔事务。在上表的购物篮事务中,每一笔事务都表示一次购物行为。 项集(T): 阅读全文
posted @ 2017-12-11 11:28 yuanninesuns 阅读(3612) 评论(0) 推荐(0) 编辑