数据挖掘Apriori算法——学习笔记

关联规则、频繁项集、支持度、置信度

关联规则挖掘:

一起购买的商品

 

支持度(support)

 支持度会随着物品增多而减小。因为是同时购买的比率。

置信度(Confidence)

频繁且强规则,有一定意义。

Apriori算法

太复杂。

先寻找频繁项集(大于所设置阈值),这时剔除掉不频繁的了。

构建下一个候选项集,再次寻找频繁项集L2(图中字打错了)

优缺点

解决:数据表压缩/快速查找特性进行项集的选择/抽取部分数据代表整体

 

posted @ 2018-12-27 21:04  ostartech  阅读(270)  评论(0编辑  收藏  举报