摘要: 一、Apriori原理 Apriori是关联分析中较早的一种方法,主要用来挖掘那些频繁项集合,其思想是: 1.如果一个项目集合不是频繁集合,那么任何包含它的项目(超集)也一定不是频繁集。 2.如果一个项目集合是频繁集合,那么它的任何非空子集(子集)也是频繁集合。 二、关联分析... 阅读全文
posted @ 2014-11-03 20:40 DianaCody 阅读(621) 评论(0) 推荐(0) 编辑
摘要: 一、聚类 1.基于划分的聚类:k-means、k-medoids(每个类别找一个样本来代表)、Clarans 2.基于层次的聚类:(1)自底向上的凝聚方法,比如Agnes (2)自上而下的分裂方法... 阅读全文
posted @ 2014-11-03 08:49 DianaCody 阅读(813) 评论(0) 推荐(0) 编辑
摘要: AdaBoost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。 AdaBoost其实只是boost的一个特例。 一、流程图 1. 要训练出多个弱分类器(图中为3... 阅读全文
posted @ 2014-11-03 07:58 DianaCody 阅读(2340) 评论(0) 推荐(0) 编辑