聚类算法概述1--相似性度量
一 聚类中的相似性度量:
以下方法适用于直接对raw data进行相似性的度量,或者对比提取features之后的dada的相似性。
1:距离
1)Lr norm距离:
如果是L1 norm,那就是绝对值/曼哈顿距离(Manhattan distance),d(i,j)=|xi-xj|+|yi-yj|。
如果是L2 norm,那就是著名的欧式距离(Euclidean distance)了,应用最广泛。
如果,supremum距离,计算两个向量相差最大的维度的距离。
2) 马氏距离:Mahalanobis距离:
http://www.a-site.cn/article/217247.html-----结合PCA的推导来看,特别是协方差矩阵即X*trans(X)
https://www.cnblogs.com/Weirping/articles/6613013.html