模糊合并中的笔记
process.extractOne(
query="中国平安",
choices=["中国 平安"],
scorer=fuzz.token_set_ratio,
score_cutoff=0)
process.extractOne(
query="中国 平安 人寿保险 股份 东莞 中心 支公司 长安 营业部",
choices=["中国 平安"],
scorer=fuzz.token_set_ratio,
score_cutoff=0)
# ('中国 平安', 100)
process.extractOne(
query="中国 平安 人寿保险 股份 东莞 中心 支公司 长安 营业部",
choices="中国 平安",
scorer=fuzz.token_set_ratio,
score_cutoff=0)
# ('中', 6)
# 为什么上述两行代码返回的结果不一样
fuzz.ratio("中国 平安 人寿保险 股份 东莞 中心 支公司 长安 营业部", "中国 平安")
# 29
fuzz.partial_ratio("中国 平安 人寿保险 股份 东莞 中心 支公司 长安 营业部", "中国 平安")
# 100
fuzz.token_sort_ratio("中国 平安 人寿保险 股份 东莞 中心 支公司 长安 营业部", "中国 平安")
# 29
fuzz.token_set_ratio("中国 平安 人寿保险 股份 东莞 中心 支公司 长安 营业部", "中国 平安")
# 100
fuzz.partial_token_sort_ratio("中国 平安 人寿保险 股份 东莞 中心 支公司 长安 营业部", "中国 平安")
# 60
fuzz.partial_token_set_ratio("中国 平安 人寿保险 股份 东莞 中心 支公司 长安 营业部", "中国 平安")
# 100