会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
寒杰士
博客园
管理
2018年4月30日
TFIDF之python实现
摘要: TFIDF介绍 现在有一篇长文《中国的蜜蜂养殖》,用计算机提取它的关键词。 1、词频:如果某个词很重要,它应该在这篇文章中多次出现。我们进行"词频"(Term Frequency,缩写为TF)统计。 2、停用词:结果你肯定猜到了,出现次数最多的词是 "的"、"是"、"在" 这一类最常用的词。它们叫做
阅读全文
posted @ 2018-04-30 20:07 寒杰士
阅读(25984)
评论(2)
推荐(2)
编辑
公告