Data Mining --- Association Rule Mining
一、基本概念
支持度:support(a→b)=P(ab)
置信度:confidence(a→b)=P(b|a)=P(ab)/P(a)
相关性:Lift(a→b)=P(ab)/P(a)P(b)
二、Aprior算法
*Partition:扫描两遍数据库
将数据分块,第一遍每块选出频繁集,第二遍找出全局频繁集。
*DHP:减少candidate数量
*DIC:减少扫描次数
三、FP-tree
四、挖掘多层关联规则
1.uniform support:
层间支持度相同,若祖先不频繁,则其后代也不频繁,可剪枝。
2.reduced support:
层间支持度递减,若祖先不满足本层最小支持度,其后代可能满足,若剪枝会丢失频繁项。