摘要: 步骤三:文档相似度的计算 在得到每一篇文档对应的主题向量后,我们就可以计算文档之间的相似度,进而完成如文本聚类、信息检索之类的任务。在Gensim中,也提供了这一类任务的API接口。 以信息检索为例。对于一篇待检索的query,我们的目标是从文本集合中检索出主题相似度最高的文档。 首先,我们需要将待 阅读全文
posted @ 2022-03-28 08:00 青竹之下 阅读(17) 评论(0) 推荐(0) 编辑