会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
乡间小路
博客园
首页
新随笔
联系
订阅
管理
2017年7月10日
结巴(jieba)中文分词及其应用实践
摘要: 中文文本分类不像英文文本分类一样只需要将单词一个个分开就可以了,中文文本分类需要将文字组成的词语分出来构成一个个向量。所以,需要分词。 这里使用网上流行的开源分词工具结巴分词(jieba),它可以有效的将句子里的词语一个个的提取出来,关于结巴分词的原理此处不再赘述,关键是他的使用方法。1、安装 结巴
阅读全文
posted @ 2017-07-10 10:25 乡间小路
阅读(4771)
评论(1)
推荐(3)
编辑
公告