摘要: TF-IDF(Term Frequency-Inverse Document Frequency),是用来衡量一个词在文档中的重要性,下面看一下TDF-IDF的公式: 首先是TF,也就是词频,用来衡量一个词在文档中出现频率的指标。假设某词在文档中出现了( n )次,而文档总共包含( N )个词,则该 阅读全文
posted @ 2024-08-22 11:18 TW-NLP 阅读(559) 评论(2) 推荐(0) 编辑