yangyang12138

导航

nltk(一)

1.wsd模块

返回上下文中不明确单词的synset。

nltk.wsd.lesk(['I', 'went', 'to', 'the', 'bank', 'to', 'deposit', 'money', '.'], 'bank')

 

2.util模块

from nltk.util import *

 

choose这个函数是一种快速计算二项式系数的方法,通常称为nck,即一次取k的n个事物的组合数。

 

 

 bigram返回二项组合

 

 

trigrams以迭代器的形式返回从一系列项生成的三角图

 

 ngram以迭代器的形式返回从一系列项生成的ngrams。

 

 flatten把清单弄平。

 

 guess_encoding 尝试对字符串进行解码,返回正确的解码方式

posted on 2020-03-10 00:51  杨杨09265  阅读(180)  评论(0编辑  收藏  举报