2011年12月8日

关联规则挖掘(二):Apriori算法

摘要: 1 算法简介在数据挖掘领域,Apriori算法是挖掘关联规则的经典算法。Apriori算法采用的是自底向上的方法,从1-频繁集开始,逐步找出高阶频繁集。它的基本流程是:第一次扫描交易数据库D时,产生1-频繁集。在此基础上经过连接、修剪产生2-频繁集。以此类推,直到无法产生更高阶的频繁集为止。在第k次循环中,也就是产生k-频繁集的时候,首先产生k-候选集,k-候选集中每一个项集都是对两个只有一个项不同的属于k-1频繁集的项集连接产生的,k-候选集经过筛选后产生k-频繁集。2 理论基础首先来看一个频繁集的性质。定理:如果项目集X是频繁集,那么它的非空子集都是频繁集。根据定理,已知一个k-频繁集的项 阅读全文

posted @ 2011-12-08 21:11 OpenNaive 阅读(701) 评论(0) 推荐(0) 编辑

导航