windows NLTK 安装
最近在搞地理编码,用户输入一串关键字,要识别到行政区划,道路,社区,小区名,甚至门牌号,就我一个一个人要做成百度高德那样的效果(然后就硬着头皮做了,反正难度挺大,做了两个月大体上差不多了,但还是差别很大),想来想去还是得在分词这儿入手,之前写了个字典树,用最长匹配来识别,可能我写的有bug吧反正效果不太理想,不知道该怎么做了,病急乱投医,就想试试NLP怎么样,记录了一下安装过
环境 win 10 + py 3.6.3 x 64
![](https://images2017.cnblogs.com/blog/775600/201712/775600-20171217122159749-1539186013.png)
接下来安装pip,在https://pypi.python.org/pypi/pip里下载,选择tar.gz 那个,下载完解压,在管理员cmd下进入该文件夹,运行python step.py.install,不用管理员权限会报错,然后配置环境变量(默认会安装在python的根目录下文件名叫Scripts),完成后cmd 下pip一下
![](https://images2017.cnblogs.com/blog/775600/201712/775600-20171217123221046-301334255.png)
接下来就是安装nltk 了 进入pythony IDE 输入 import nltk nltk.download()
出现下面界面
![](https://images2017.cnblogs.com/blog/775600/201712/775600-20171217123419858-1219888235.png)
选择book然后download ,也可以直接下载这个book资源
git clone https://github.com/nltk/nltk_data.git 把里面的packages 改名为nltk_data 然后放到C:\Users\wangnanhui\AppData\Roaming 下
检测是否安装完成
![](https://images2017.cnblogs.com/blog/775600/201712/775600-20171217123752171-281206979.png)