摘要:
http://www.cnblogs.com/Raymon-Geng/p/5784290.html 这里有三种方法, 当需要输出的结果要求有两位小数的时候,字符串形式的:'%.2f' % a 方式最好,其次用Decimal。 需要注意的: 1. 可以传递给Decimal整型或者字符串参数,但不能是浮 阅读全文
摘要:
1 tf -idf tf 在某个文件中的词频 计算方法: 某文件中的某个词的数量除以整个文件中所有词的数量 idf,逆向文件频率,用所有文件数除以包含某个词的文件数,再取对数,表示,单词在所有文件中出现 频率 的倒数 tf*idf ,表示单词对文件的重要程度,倾向于选取那些不觉见,但是重要的单词。 阅读全文