windows 10安装gensim、nltk
一、安装gensim
1、什么事gensim
gensim是一个python的科学库,gensim包含了TF-IDF、随机投影、word2vec和document2vec算法的实现,分层Dirchlet过程(HDP),潜在语义分析(LSA)和潜在Dirichlet分配(LDA),包括分布式并行版本。主要是用来主题建模、文档索引以及使用大规模语料数据的相似性检索,被作者称为“根据纯文本进行监督性建模最健壮、最有效的、最让人放心的软件”。
2、安装
gensim可以安装在Windows、Linux和Mac OS以及其他的平台,但是它需要依赖python和numpy以及scipy,如下图
1、安装numpy
pipenv install numpy
2、安装scipy
pipenv install scipy
3、安装gensim
pipenv install gensim
4、验证是否安装成功
二、安装gensim
nltk的全称是natural language toolkit,是一套基于python的自然语言处理工具集。
nltk的安装十分便捷,只需要pip就可以:
pip install nltk
在nltk中集成了语料与模型等的包管理器,通过在python解释器中执行
>>> import nltk
>>> nltk.download()
便会弹出下面的包管理界面,在管理器中可以下载语料,预训练的模型等。