2018年8月9日

python实战,中文自然语言处理,应用jieba库来统计文本词频

摘要: 模块介绍 安装:pip install jieba 即可 jieba库,主要用于中文文本内容的分词,它有3种分词方法: 1. 精确模式, 试图将句子最精确地切开,适合文本分析: 2. 全模式,把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义; 3. 搜索引擎模式,在精确模式的基础 阅读全文

posted @ 2018-08-09 08:31 python小玩家 阅读(1923) 评论(0) 推荐(0) 编辑

导航