会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
叶落花开
博客园
首页
新随笔
联系
订阅
管理
2014年5月6日
ubuntu 14.04中文分词 结巴分词
摘要: 在自然语言处理中,很常见的是要对文本数据进行分词处理。博主是代码小白,目前只是用python作为数据预处理的工具,而按照结巴中文分词的导语:做最好的python中文分词组件“jieba”。因而博主也就在本人的机子上安装了 ubuntu+python2.7+jieba组成的分词组合。关于安装的博客已经...
阅读全文
posted @ 2014-05-06 13:56 叶落花开
阅读(3873)
评论(0)
推荐(0)
编辑
公告