摘要: 关键词句和文本集每篇文章相关度计算:假设语料库中有几万篇文章,每篇文章的长度不一,你任意输入关键词或句子,通过代码以tf-idf值为准检索出来相似度高的文章。 1、TF-IDF概述 TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文 阅读全文
posted @ 2018-08-03 08:44 J.mg 阅读(1101) 评论(0) 推荐(0) 编辑