摘要: 原文链接:​​​​​​​http://tecdat.cn/?p=6852 知识点普及 词频:某个词在该文档中出现的次数停用词:数据处理时过滤掉某些字或词,如:网站、的等语料库:也就是我们要分析的所有文档的集合中文分词:将汉字序列分成一个个单独的词 使用第三方库介绍 jieba jieba.cut(c 阅读全文
posted @ 2018-08-24 16:04 拓端tecdat 阅读(311) 评论(0) 推荐(0) 编辑