比较两段文本的相似度

该方法的原理：逐行查找第二个文本是否有第一个文本内该元素的匹配序列，有则认为是重复的，最终输出一个匹配度

from difflib import SequenceMatcher 

def file_similarity_checker(f1,f2):
  checking = SequenceMatcher(None,f1,f2).ratio()
  print(f'文本相似度为{checking*100}%')
  return checking

posted @ 2022-11-15 14:40 dewei233 阅读(311) 评论(0) 收藏举报

刷新页面返回顶部