便签_Python

模糊合并中的笔记

process.extractOne(
        query="中国平安",
        choices=["中国 平安"],
        scorer=fuzz.token_set_ratio,
        score_cutoff=0)


process.extractOne(
        query="中国 平安 人寿保险 股份 东莞 中心 支公司 长安 营业部",
        choices=["中国 平安"],
        scorer=fuzz.token_set_ratio,
        score_cutoff=0)
# ('中国 平安', 100)

process.extractOne(
        query="中国 平安 人寿保险 股份 东莞 中心 支公司 长安 营业部",
        choices="中国 平安",
        scorer=fuzz.token_set_ratio,
        score_cutoff=0)
#  ('中', 6)

# 为什么上述两行代码返回的结果不一样

fuzz.ratio("中国 平安 人寿保险 股份 东莞 中心 支公司 长安 营业部", "中国 平安")
# 29
fuzz.partial_ratio("中国 平安 人寿保险 股份 东莞 中心 支公司 长安 营业部", "中国 平安")
# 100
fuzz.token_sort_ratio("中国 平安 人寿保险 股份 东莞 中心 支公司 长安 营业部", "中国 平安")
# 29
fuzz.token_set_ratio("中国 平安 人寿保险 股份 东莞 中心 支公司 长安 营业部", "中国 平安")
# 100
fuzz.partial_token_sort_ratio("中国 平安 人寿保险 股份 东莞 中心 支公司 长安 营业部", "中国 平安")
# 60
fuzz.partial_token_set_ratio("中国 平安 人寿保险 股份 东莞 中心 支公司 长安 营业部", "中国 平安")
# 100

posted @ 2023-03-21 23:14  梁书源  阅读(28)  评论(0编辑  收藏  举报