摘要: 在文本挖掘预处理之向量化与Hash Trick中我们讲到在文本挖掘的预处理中,向量化之后一般都伴随着TF-IDF的处理,那么什么是TF-IDF,为什么一般我们要加这一步预处理呢?这里就对TF-IDF的原理做一个总结。 1. 文本向量化特征的不足 在将文本分词并向量化后,我们可以得到词汇表中每个词在各 阅读全文
posted @ 2019-04-12 13:23 Clownszz 阅读(3471) 评论(0) 推荐(0) 编辑