所以燃

Data Mining --- Clustering

一、二元变量距离

image

 

image

 

二、划分法:K-means聚类(需要确定K)

image

 

三、层次法:分层聚类(需终止条件)

image

image

*BIRCH:集成分层聚类(CF-tree)

image

*CURE:使用代表聚类

image

 

四、基于密度的聚类:DBSCAN

1.直接密度可达:

image

2.密度可达:

image

3.密度连通:

image

image

 

五、基于网格的聚类:STING(统计信息网格)

image

image

 

六、Outlier检测

1.统计方法:多数情况下不知道数据分布

image

2.index-based algorithm

image

3.nested-loop algorithm

image

4.cell-based algorithm

image

posted on 2013-12-10 00:12  Jizhiyuan  阅读(412)  评论(0编辑  收藏  举报

导航