摘要: 基于编辑距离和最长公共子串实现的文本相似度计算:计算公式为s=lc/(led+lc)lc为最长公共子串的长度led为编辑距离考虑到汉字和字符的不同,增加了Str2Word()进行字符串分词,实现单字的比较。代码写了一段时间了,有些遗忘。ld()为编辑距离求解lcsLen()为动态规划求解最长公共子串... 阅读全文
posted @ 2013-07-28 23:32 kuduogedi 阅读(389) 评论(0) 推荐(0) 编辑