聚类算法概述1--相似性度量

一 聚类中的相似性度量:

以下方法适用于直接对raw data进行相似性的度量,或者对比提取features之后的dada的相似性。

1:距离

1)Lr norm距离:

如果是L1 norm,那就是绝对值/曼哈顿距离(Manhattan distance),d(i,j)=|xi-xj|+|yi-yj|。

如果是L2 norm,那就是著名的欧式距离(Euclidean distance)了,应用最广泛。

如果L\rightarrow \infty,supremum距离,计算两个向量相差最大的维度的距离

2) 马氏距离:Mahalanobis距离:

http://www.a-site.cn/article/217247.html-----结合PCA的推导来看,特别是协方差矩阵即X*trans(X)

https://www.cnblogs.com/Weirping/articles/6613013.html


posted @ 2018-03-19 15:48  JadeCicada  阅读(519)  评论(0编辑  收藏  举报