2017年6月29日
摘要: 在做英文文本处理时,常常会遇到这样的情况,需要我们提取出里面的词组进行主题抽取,尤其是具有行业特色的,比如金融年报等。其中主要进行的是进行双连词和三连词的抽取,那如何进行双连词和三连词的抽取呢?这是本文将要介绍的具体内容。 1. nltk.bigrams(tokens) 和 nltk.trigram 阅读全文
posted @ 2017-06-29 21:38 寒若雪 阅读(5479) 评论(0) 推荐(2) 编辑