Data Mining --- Association Rule Mining

一、基本概念

支持度：support(a→b)=P(ab)

置信度：confidence(a→b)=P(b|a)=P(ab)/P(a)

相关性：Lift(a→b)=P(ab)/P(a)P(b)

二、Aprior算法

*Partition：扫描两遍数据库

将数据分块，第一遍每块选出频繁集，第二遍找出全局频繁集。

*DHP：减少candidate数量

*DIC：减少扫描次数

三、FP-tree

四、挖掘多层关联规则

1.uniform support：

层间支持度相同，若祖先不频繁，则其后代也不频繁，可剪枝。

2.reduced support：

层间支持度递减，若祖先不满足本层最小支持度，其后代可能满足，若剪枝会丢失频繁项。

posted on 2013-12-09 23:01 Jizhiyuan 阅读(581) 评论(0) 编辑收藏举报

努力加载评论中...

刷新页面返回顶部

所以燃