距离

进行相似度度量的时候会用到各种度量距离的方法,根据MATLAB的help文档整理如下:

关于各种距离的定义:

之间的距离

1.欧式距离(Euclidean distance) ,写成向量形式;

2.曼哈顿距离又叫城市街区距离(CityBlock distance) :

3.切比雪夫距离(Chebychev distance): ,也可以表示成

4.以上三种称为闵式距离,形式为,p=1时是曼哈顿距离;p=2时是欧氏距离;p趋于无穷时是切比雪夫距离。

5.马氏距离(Mahalanobis distance):记两个(或多个)样本的协方差矩阵为S,则马氏距离为

6.汉明距离(Hamming distance):主要针对信息编码,指的是将其中的一个变量变成另外一个变量所需要的替换次数。1001到1111的汉明距离是2。

7.杰卡德距离( Jaccard distance):用来衡量两个集合中元素的相似度 , 表示集合中元素的个数。

posted @ 2016-03-20 13:23  司马_羽鹤  阅读(252)  评论(0编辑  收藏  举报