摘要: #规则产生忽略那些前件和后件为空的规则,每个频繁k项集能够产生$2(2^k-1)$个关联规则。将频繁项集Y划分为两个非空子集X和Y-X,使得$X \to Y-X$能满足置信度阈值,就可以得到满足条件的规则。在计算规则的置信度时并不需要再次扫描事务数据集,因为产生规则的频繁项集和它们的子集也都是频繁项... 阅读全文
posted @ 2015-08-18 22:20 Beavers 阅读(5871) 评论(0) 推荐(1) 编辑
摘要: #频繁项集的产生**格结构**(lattice structure)常常用来表示所有可能的项集。![](http://images0.cnblogs.com/blog2015/799078/201508/182151419413985.png)发现频繁项集的一个原始方法是确定格结构中每个候选项集的支... 阅读全文
posted @ 2015-08-18 21:58 Beavers 阅读(25791) 评论(0) 推荐(2) 编辑
摘要: 许多商业企业运营中的大量数据,通常称为购物篮事务(market basket transaction)。表中每一行对应一个事务,包含一个唯一标识TID。![购物篮数据](http://images0.cnblogs.com/blog2015/799078/201508/182103284105408... 阅读全文
posted @ 2015-08-18 21:05 Beavers 阅读(26265) 评论(0) 推荐(1) 编辑
摘要: #处理连续属性挖掘连续属性可能揭示数据的内在联系,包含连续属性的关联规则通常称**作量化关联规则**(quantitative association rule)。主要讨论三种对连续数据进行关联分析的方法1. 基于离散化的方法2. 基于统计学的方法3. 非离散化方法##基于离散化方法离散化是处理连续... 阅读全文
posted @ 2015-08-18 20:39 Beavers 阅读(8603) 评论(0) 推荐(1) 编辑