会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
利炳根
敲代码、学日语,不做任何付费咨询
博客园
|
首页
|
新随笔
|
新文章
|
联系
|
订阅
|
管理
2018年2月13日
学习笔记CB002:词干提取、词性标注、中文切词、文档分类
摘要: 英文词干提取器,import nltk,porter = nltk.PorterStemmer(),porter.stem('lying') 。 词性标注器,pos_tag处理词序列,根据句子动态判断,import nltk,text = nltk.word_tokenize("And now fo
阅读全文
posted @ 2018-02-13 13:18 利炳根
阅读(1011)
评论(0)
推荐(0)
编辑
公告