2022年4月29日
摘要: 文本相似度检查实现 最近需要做一个文章标题相似度检测提醒,所以了解一下相关的算法,整理如下。 Hamming Distance 汉明距离 汉明距离是一个概念,它表示两个(相同长度)字符串对应位置的不同字符的数量,我们以d(x,y)表示两个字x,y之间的汉明距离。对两个字符串进行异或运算,并统计结果为1的个数,那么这个数 阅读全文
posted @ 2022-04-29 11:19 一级码农VIP 阅读(227) 评论(0) 推荐(0) 编辑