2014 年 5月 6 日随笔档案 - 叶落花开

2014年5月6日

摘要：在自然语言处理中，很常见的是要对文本数据进行分词处理。博主是代码小白，目前只是用python作为数据预处理的工具，而按照结巴中文分词的导语：做最好的python中文分词组件“jieba”。因而博主也就在本人的机子上安装了 ubuntu+python2.7+jieba组成的分词组合。关于安装的博客已经... 阅读全文

posted @ 2014-05-06 13:56 叶落花开阅读(3873) 评论(0) 推荐(0) 编辑

叶落花开

公告