摘要: 任务一:现在有一篇长文《中国的蜜蜂养殖》,用计算机提取它的关键词。 1、词频:如果某个词很重要,它应该在这篇文章中多次出现。我们进行"词频"(Term Frequency,缩写为TF)统计。 2、停用词:结果你肯定猜到了,出现次数最多的词是 "的"、"是"、"在" 这一类最常用的词。它们叫做"停用词 阅读全文
posted @ 2016-10-19 10:22 小_龟 阅读(35050) 评论(0) 推荐(3) 编辑