摘要: '''TFIDF原理 TF:单词词频。一个词在文章中出现的频率,公式:tf=词在文章中出现的次数/文章总的词汇数。文章可以是一个句子,也可以是一篇文章,根据具体情况定。 idf:逆文件频率。词在该文章中出现的次数越少,越能够代表该文章。 IDF=log(语料库的总文档数/包含该词条的文档数+1),分 阅读全文
posted @ 2020-04-12 07:38 HHHarden13 阅读(80) 评论(0) 推荐(0) 编辑