pyhon简单比较文本相似度的方法

1.安装

命令:sudo apt-get install python-Levenshtein

2.主要使用

import Levenshtein

similarRate = Levenshtein.ratio('第一章 刺杀','第1章 刺杀')

print similarRate 

3.其它常见使用

1. Levenshtein.hamming(str1, str2)

注:要求str1和str2必须长度一致。是描述两个等长字串之间 对应位置上不同字符的个数。如

2. Levenshtein.distance(str1, str2)

注:描述由一个字串转化成另一个字串最少的操作次数,在其中的操作包括插入、删除、替换 。如

 

 

单词单位和字符单位还是有区别的

 

posted @   lingwang3  阅读(438)  评论(1编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
点击右上角即可分享
微信分享提示