2018年11月3日

英文文本的词频统计

摘要: 英文文本由于不涉及分词问题,词频统计相对而言简单一些。以下是一个对英文文本进行词频统计的例子。其中的关键问题有:(1)英文中同时存在大小写,会干扰词频统计的结果,所以应将所有的英文字母转化为大写或小写;(2)英文单词可能被空格、标点或其他特殊符号分隔,因此应将这些特殊符号统一替换为空格;(3)根据空 阅读全文

posted @ 2018-11-03 20:41 Python大数据 阅读(1794) 评论(0) 推荐(0) 编辑

导航