摘要: 在相似文本的推荐中,可以用TF-IDF来衡量文章之间的相似性。 一、TF(Term Frequency) TF的含义很明显,就是词出现的频率。 公式: 在算文本相似性的时候,可以采用这个思路,如果两篇文章高频词很相似,那么就可以认定两片文章很相似。 二、IDF(Inverse Document Fr 阅读全文
posted @ 2019-01-03 14:05 ylxn 阅读(609) 评论(0) 推荐(0) 编辑