NLP初试牛刀,NLTK入门第一篇
之前下载过一个PDF,书名是《用python进行自然语言处理》,挺有意思的,加上NLP和机器学习目前大热,想趁着暑假涉猎一下。于是开始了入门NLP之旅。
安装环境:Ubuntu14.04桌面版,python版本:2.7
第一步:安装nltk,首先要安装pip工具:sudo apt-get install python-pip,安装完成后用pip安装nltk:sudo pip install python-nltk。
第二步:下载nltk所有的包,在终端中进入python的交互模式,
>>> import nltk >>> nltk.download() >>> d >>> all
接着就等吧,包很大,我断断续续下了两三天才下完。
第三步,安装numpy和matplotlib工具,主要是用来数据分析和图形化显示。下面是引用别人的一部分:
安装numpy相对简单,以下命令可以完成
$ sudo apt-get install python-numpy $ sudo apt-get install python-scipy
安装matplotlib相对复杂一些
需要先安装其依赖的包libpng和freetype
安装libpng:
$ sudo apt-get install libpng-dev
安装freetype:
$ cd ~/Downloads $ wget http://download.savannah.gnu.org/releases/freetype/freetype-2.4.10.tar.gz $ tar zxvf freetype-2.4.10.tar.gz $ cd freetype-2.4.10/ $ ./congfigure $ make $ sudo make install
安装好pip后就可以用下面的命令来查找matplotlib和查看其安装状态
$ sudo pip search matplotlib
安装matplotlib
$ sudo pip install matplotlib
完成上述的步骤,就可以正式进入NLTK学习啦!