摘要:
1)概述 两者都是评定个体间差异的大小的。欧几里得距离度量会受指标不同单位刻度的影响,所以一般需要先进行标准化,同时距离越大,个体间差异越大; 空间向量余弦夹角的相似度度量不会受指标刻度的影响,余弦值落于区间[-1,1],值越大,差异越小。2)计算公式 欧氏距离(也叫欧几里得距离)公式: 余弦相似度的计算公式如下:3)归一化一般来说,为了比较的方便,都会对得到的结果进行归一化处理:1)在欧氏距离公式中,取值范围会很大,一般通过如下方式归一化: sim = 1 / (1 +dist(X,Y))2)因为余弦值的范围是 [-1,+1] ,相似度计算时一般需要把值归一化到 [0,1],一般通... 阅读全文