会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
叶落花开
博客园
首页
新随笔
联系
订阅
管理
2014年5月30日
用python做中文自然语言预处理
摘要: 这篇博客根据中文自然语言预处理的步骤分成几个板块。以做LDA实验为例,在处理数据之前,会写一个类似于实验报告的东西,用来指导做实验,OK,举例:一,实验数据预处理(python,结巴分词)1.对于爬取的评论做分词和词性标注处理(mac-result.txt)2.对于结果只用公版的停用词表去停用词,不...
阅读全文
posted @ 2014-05-30 12:32 叶落花开
阅读(11163)
评论(1)
推荐(0)
编辑
公告