摘要: Dice距离用于度量两个集合的相似性,因为可以把字符串理解为一种集合,因此Dice距离也会用于度量字符串的相似性。此外,Dice系数的一个非常著名的使用即实验性能评测的F1值。Dice系数定义如下: Dice 系数可以计算两个字符串的相似度: $Dice(s1,s2)=\frac{2*comm(s1 阅读全文
posted @ 2021-03-16 11:42 早起的小虫子 阅读(1781) 评论(0) 推荐(0) 编辑
摘要: TextRank 算法是一种用于文本的基于图的排序算法,其基本思想来源于谷歌的 PageRank算法,通过把文本分割成若干组成单元(句子),构建节点连接图,用句子之间的相似度作为边的权重,通过循环迭代计算句子的TextRank值,最后抽取排名高的句子组合成文本摘要。 自动文本摘要是自然语言处理(NL 阅读全文
posted @ 2021-03-16 10:56 早起的小虫子 阅读(1277) 评论(0) 推荐(0) 编辑