python中文分词,使用结巴分词对python进行分词
摘要:
在采集美女站时,需要对关键词进行分词,最终采用的是python的结巴分词方法. 中文分词是中文文本处理的一个基础性工作,结巴分词利用进行中文分词。其基本实现原理有三点: 安装(Linux环境) 下载工具包,解压后进入目录下,运行:python setup.py install 模式 接口 组件只提供 阅读全文
posted @ 2017-11-13 23:16 yangjiyue 阅读(14259) 评论(0) 推荐(0) 编辑