摘要: TF-IDF TF-IDF统计的是词库所有词的出现频率与在文件级出现频率的倒数的对数乘积。 TF:即词语出现的频率。 IDF:记每个词出现的文件数为 file_i,总文件数为file_num,IDF[I] = log(file_num/(1+file_i)) TF-IDF = TF * IDF 1 阅读全文
posted @ 2019-11-15 13:25 巴蜀秀才 阅读(441) 评论(0) 推荐(0) 编辑