所以燃

Data Mining --- Association Rule Mining

一、基本概念

支持度:support(a→b)=P(ab)

置信度:confidence(a→b)=P(b|a)=P(ab)/P(a)

相关性:Lift(a→b)=P(ab)/P(a)P(b)

 

二、Aprior算法

image

*Partition:扫描两遍数据库

将数据分块,第一遍每块选出频繁集,第二遍找出全局频繁集。

*DHP:减少candidate数量

image

*DIC:减少扫描次数

image

 

三、FP-tree

image

image

 

四、挖掘多层关联规则

1.uniform support:

层间支持度相同,若祖先不频繁,则其后代也不频繁,可剪枝。

2.reduced support:

层间支持度递减,若祖先不满足本层最小支持度,其后代可能满足,若剪枝会丢失频繁项。

 

posted on 2013-12-09 23:01  Jizhiyuan  阅读(577)  评论(0编辑  收藏  举报

导航