比较两段文本的相似度

比较两段文本的相似度

该方法的原理:逐行查找第二个文本是否有第一个文本内该元素的匹配序列,有则认为是重复的,最终输出一个匹配度

from difflib import SequenceMatcher 

def file_similarity_checker(f1,f2):
  checking = SequenceMatcher(None,f1,f2).ratio()
  print(f'文本相似度为{checking*100}%')
  return checking 

posted @ 2022-11-15 14:40  dewei233  阅读(308)  评论(0)    收藏  举报