摘要: 在自然语言处理中,很常见的是要对文本数据进行分词处理。博主是代码小白,目前只是用python作为数据预处理的工具,而按照结巴中文分词的导语:做最好的python中文分词组件“jieba”。因而博主也就在本人的机子上安装了 ubuntu+python2.7+jieba组成的分词组合。关于安装的博客已经... 阅读全文
posted @ 2014-05-06 13:56 叶落花开 阅读(3873) 评论(0) 推荐(0) 编辑