统计学-距离函数

欧式距离

是两点间“普通”(即直线)距离

公式为:

闵可夫斯基距离Minkowski

是欧氏空间中的一种测度,被看做是欧氏距离的一种推广,公式为:

 

 

 闵可夫斯基距离公式中,当时,即为欧氏距离;当p=1时,即为曼哈顿距离;当p趋于无穷时,即为切比雪夫距离

规范化的欧几里得距离

标准化后的值 =  ( 标准化前的值  - 分量的均值 ) /分量的标准差

 

其中SK是分量的标准差

切比雪夫距离

不知道有什么卵用,不过可以转化为曼哈顿

曼哈顿距离

也叫出租车距离,用来标明两个点在标准坐标系上的绝对轴距总和

 

 

角距离

角距离,是由一定点到两物体之间所量度的夹角

余弦距离

欧式距离体现的是距离上的绝对差异,余弦距离体现的是方向上的相对差异

 

 

杰卡德距离Jaccard

杰卡德距离(Jaccard Distance) 是用来衡量两个集合差异性的一种指标,它是杰卡德相似系数的补集,被定义为1减去Jaccard相似系数。而杰卡德相似系数(Jaccard similarity coefficient),也称杰卡德指数(Jaccard Index),是用来衡量两个集合相似度的一种指标。

 

 

马氏距离

表示点与一个分布之间的距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧式不同的是,它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的),并且是尺度无关的(scale-invariant),即独立于测量尺度。可以看作是欧氏距离的一种修正,修正了欧式距离中各个维度尺度不一致且相关的问题。

 

 其中Σ是多维随机变量的协方差矩阵,μ为样本均值,如果协方差矩阵是单位向量,也就是各维度独立同分布,马氏距离就变成了欧氏距离

 但是要求协方差矩阵必须满秩,而且不能处理非线性流形上的问题

 

汉明距离

posted @ 2020-11-14 14:39  墨冰心  阅读(1143)  评论(0编辑  收藏  举报