Data Mining --- Clustering
一、二元变量距离
二、划分法:K-means聚类(需要确定K)
三、层次法:分层聚类(需终止条件)
*BIRCH:集成分层聚类(CF-tree)
*CURE:使用代表聚类
四、基于密度的聚类:DBSCAN
1.直接密度可达:
2.密度可达:
3.密度连通:
五、基于网格的聚类:STING(统计信息网格)
六、Outlier检测
1.统计方法:多数情况下不知道数据分布
2.index-based algorithm
3.nested-loop algorithm
4.cell-based algorithm