关于TF-IDF的解释
摘要:TF:term frequency ,词频 。指的是 term 出现的评率。词频和 2 个因数有关,在一个文档中出现这个词条次数越多,词频越高,文档总词条总数越多这个值被稀释。 所以 一般 TF = 词条在文档出现的次数 / 文档总词数。 IDF:倒排索引的频率。 log ( docment 数量/
阅读全文
posted @ 2018-10-30 14:59
posted @ 2018-10-30 14:59
posted @ 2018-10-11 15:48
posted @ 2018-09-06 00:16
posted @ 2018-08-26 20:36
posted @ 2018-08-13 22:09
posted @ 2018-08-13 21:20