啤酒 尿布
组合营销
X=》Y,其中x属于项集I,Y属于项集I,且X、Y的交集等于空集。
2类算法
Apriori算法 不断地构造候选集、筛选候选集来挖掘出频繁项集,需要多次扫描原始数据、磁盘I/O
频繁模式增长算法 只需扫描原始数据2遍,通过FP-tree数据结构对原始数据进行压缩,效率高
关联规则association rules 挖掘 ,属于描述型模式,无监督学习