摘要: 在文本挖掘预处理之向量化与Hash Trick中我们讲到在文本挖掘的预处理中,向量化之后一般都伴随着TF-IDF的处理,那么什么是TF-IDF,为什么一般我们要加这一步预处理呢?这里就对TF-IDF的原理做一个总结。 1. 文本向量化特征的不足 在将文本分词并向量化后,我们可以得到词汇表中每个词在各 阅读全文
posted @ 2017-04-11 14:58 刘建平Pinard 阅读(77291) 评论(39) 推荐(20) 编辑