Fork me on GitHub
摘要: 1.词频 TF(term frequency)词频,就是该分词在该文档中出现的频率,算法是:(该分词在该文档出现的次数)/(该文档分词的总数),这个值越大表示这个词越重要,即权重就越大。例如:一篇文档分词后,总共有500个分词,而分词”Hello”出现的次数是20次,则TF值是: tf =20/... 阅读全文
posted @ 2015-05-09 18:49 何海洋 阅读(4634) 评论(0) 推荐(0) 编辑