nltk(一)
1.wsd模块
返回上下文中不明确单词的synset。
nltk.wsd.lesk(['I', 'went', 'to', 'the', 'bank', 'to', 'deposit', 'money', '.'], 'bank')
2.util模块
from nltk.util import *
choose这个函数是一种快速计算二项式系数的方法,通常称为nck,即一次取k的n个事物的组合数。
bigram返回二项组合
trigrams
以迭代器的形式返回从一系列项生成的三角图
ngram以迭代器的形式返回从一系列项生成的ngrams。
flatten
把清单弄平。
guess_encoding 尝试对字符串进行解码,返回正确的解码方式