摘要: nltk的全称是natural language toolkit,是一套基于python的自然语言处理工具集。自带语料库、词性分类库、自带分类分词等功能、强大社区支持、很多简单版wrapper 文本处理: preprocess -》 分词 tokenize -》make features,成为数字化 阅读全文