2017年11月13日

python中文分词,使用结巴分词对python进行分词

摘要: 在采集美女站时,需要对关键词进行分词,最终采用的是python的结巴分词方法. 中文分词是中文文本处理的一个基础性工作,结巴分词利用进行中文分词。其基本实现原理有三点: 安装(Linux环境) 下载工具包,解压后进入目录下,运行:python setup.py install 模式 接口 组件只提供 阅读全文

posted @ 2017-11-13 23:16 yangjiyue 阅读(14254) 评论(0) 推荐(0) 编辑

导航