Data Mining --- Association Rule Mining
一、基本概念
支持度:support(a→b)=P(ab)
置信度:confidence(a→b)=P(b|a)=P(ab)/P(a)
相关性:Lift(a→b)=P(ab)/P(a)P(b)
二、Aprior算法
*Partition:扫描两遍数据库
将数据分块,第一遍每块选出频繁集,第二遍找出全局频繁集。
*DHP:减少candidate数量
*DIC:减少扫描次数
三、FP-tree
四、挖掘多层关联规则
1.uniform support:
层间支持度相同,若祖先不频繁,则其后代也不频繁,可剪枝。
2.reduced support:
层间支持度递减,若祖先不满足本层最小支持度,其后代可能满足,若剪枝会丢失频繁项。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步