比较两段文本的相似度
比较两段文本的相似度
该方法的原理:逐行查找第二个文本是否有第一个文本内该元素的匹配序列,有则认为是重复的,最终输出一个匹配度
from difflib import SequenceMatcher
def file_similarity_checker(f1,f2):
checking = SequenceMatcher(None,f1,f2).ratio()
print(f'文本相似度为{checking*100}%')
return checking
该方法的原理:逐行查找第二个文本是否有第一个文本内该元素的匹配序列,有则认为是重复的,最终输出一个匹配度
from difflib import SequenceMatcher
def file_similarity_checker(f1,f2):
checking = SequenceMatcher(None,f1,f2).ratio()
print(f'文本相似度为{checking*100}%')
return checking