摘要: 一、TF-IDF 有很多不同的数学公式可以用来计算TF-IDF。这边的例子以上述的数学公式来计算。词频 (TF) 是一词语出现的次数除以该文件的总词语数。假如一篇文件的总词语数是100个,而词语“母牛”出现了3次,那么“母牛”一词在该文件中的词频就是3/100=0.03。一个计算文件频率 (IDF) 阅读全文
posted @ 2018-11-01 09:25 Kkky 阅读(381) 评论(0) 推荐(0) 编辑