摘要: 1.TFIDF TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TFIDF实际上是:TF * IDF,TF词频(Term Frequency),IDF逆向文件频率(Inverse Document 阅读全文
posted @ 2017-05-10 09:29 nanhe 阅读(222) 评论(0) 推荐(0) 编辑