摘要: 这是文本离散表示的第二篇实战文章,要做的是运用TF-IDF算法结合n-gram,求几篇文档的TF-IDF矩阵,然后提取出各篇文档的关键词,并计算各篇文档之间的余弦距离,分析其相似度。 TF-IDF与n-gram的结合可看我的这篇文章:https://www.cnblogs.com/Luv-GEM/p 阅读全文
posted @ 2019-03-19 07:32 Luv_GEM 阅读(8109) 评论(1) 推荐(1) 编辑