NLP之距离算法Levenshtein

1安装:pip install python-Levenshtein;(但是会报错,你自己去下载这个包)

 

2.原理解析:

“”“

就是计算两个字符串之间的改动次数:改动包括(新增,修改,删除)

(1-两个字符所有的改动次数  /  两个字符之和 )  =  近似比率

”“”

3.如何使用:

import Levenshtein
s_1 = "春夏秋冬"
s_2 = "夏秋冬春"
s_3 = "秋冬春夏"
s_4 = "冬春夏秋"
print(f"需要改变的次数为:{Levenshtein.distance(s_1,s_2)},近似比:{Levenshtein.ratio(s_1,s_2)}")
print(f"需要改变的次数为:{Levenshtein.distance(s_1,s_3)},近似比:{Levenshtein.ratio(s_1,s_3)}")
print(f"需要改变的次数为:{Levenshtein.distance(s_1,s_4)},近似比:{Levenshtein.ratio(s_1,s_4)}")
------------------------------------------------------

需要改变的次数为:2,近似比:0.75
需要改变的次数为:4,近似比:0.5
需要改变的次数为:2,近似比:0.75

posted @ 2021-11-08 14:05    阅读(107)  评论(0编辑  收藏  举报