集合相似度对比的两种计算算法

相似度对比的两种计算算法:Jaccard similarity相似性系数和Ochiai coefficient落和系数

 


Jaccard coefficient:

A,B分别代表符合某种条件的集合:两个集合交集的大小/两个集合并集的大小,交集=并集意味着2个集合完全重合。

Ochiai coefficient:

A,B分别代表符合某种条件的集合:两个集合的交集大小/两个集合大小的几何平均值。是余弦相似性的一种形式。

相关参考链接:
http://en.wikipedia.org/wiki/Jaccard_coefficient
http://en.wikipedia.org/wiki/Cosine_similarity#Ochiai_coefficient

作者:车东 发表于:2013-09-09 18:09 最后更新于:2013-09-09 20:09
版权声明:可以任意转载,转载时请务必以超链接形式标明文章和作者信息及本版权声明
posted @ 2014-11-29 21:12  白婷  阅读(2867)  评论(0编辑  收藏  举报