摘要: 阶段作业1:完整的中英文词频统计 步骤: 1.准备utf-8编码的文本文件file 2.通过文件读取字符串 str 3.对文本进行预处理 4.分解提取单词 list 5.单词计数字典 set , dict 6.按词频排序 list.sort(key=) 7.排除语法型词汇,代词、冠词、连词等无语义词 阅读全文
posted @ 2018-09-29 10:40 郑裕莹 阅读(135) 评论(0) 推荐(0) 编辑