安装NLTK出现的问题与解决方法
环境:Ubuntu 10.10 + Python 2.6.6
NLTK: http://nltk.org/ 一个基于Python的自然语言处理的工具包
1.运行 sudo easy_install pip 出错,
需要将setuptools-0.6c11-py2.6.egg之类的文件,设置成可执行的文件才可以
chmod u+x setuptools-0.6c11-py2.6.egg
2.sudo pip install -U numpy
这一步如果安装失败,如出现如下的错误:
Cannot compile 'Python.h'
会导致后面 import nltk 是出现如下错误:
Cannot find numpy module
解决方法,是改用以下的命名安装numpy:
sudo apt-get install python-numpy
3. text.generate() causes AssertionError
参考:https://github.com/nltk/nltk/issues/285
需要覆盖两个文件:text.py 与 model/ngram.py
然后重新编译下整个目录即可:
import compileall compileall.compile_dir("/usr/local/lib/python2.6/dist-packages/nltk")
其中/usr/local/lib/python2.6/dist-packages/nltk 是笔者电脑上NLTK默认安装的路径