会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
不哭的女孩
博客园
首页
新随笔
联系
管理
订阅
2017年6月29日
nltk中的三元词组,二元词组
摘要: 在做英文文本处理时,常常会遇到这样的情况,需要我们提取出里面的词组进行主题抽取,尤其是具有行业特色的,比如金融年报等。其中主要进行的是进行双连词和三连词的抽取,那如何进行双连词和三连词的抽取呢?这是本文将要介绍的具体内容。 1. nltk.bigrams(tokens) 和 nltk.trigram
阅读全文
posted @ 2017-06-29 21:38 寒若雪
阅读(5479)
评论(0)
推荐(2)
编辑
公告