特征权重量化 TF-IDF 用于信息检索和数据挖掘的加权技术
摘要:TFIDF实际上是:TF * IDF,TF词频(Term Frequency),IDF逆向文件频率(Inverse Document Frequency)。TF表示词条在文档d中出现的频率。IDF的主要思想是:如果包含词条t的文档越少,也就是n越小,IDF越大,则说明词条t具有很好的类别区分能力。T...
阅读全文
posted @ 2015-12-05 19:44