摘要: 1.TF-IDF 词频-逆文档频次算法(Term Frequency-Inverse Document Frequency,TF-IDF)是一种统计特征提取算法,评估字或词对于一个文件集或语料库中一份文件的重要程度。 (1)基本思想 重要性与词在整个语料中出现的频次成正比,与出现该词的文档数成反比。 阅读全文
posted @ 2020-05-19 08:52 西伯尔 阅读(261) 评论(0) 推荐(0) 编辑