左手中倒影

hadoop技术控 大数据解决方案 hanlp研究爱好者
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

Window离线环境下如何安装pyhanlp

Posted on 2019-03-08 10:18  左手中倒影  阅读(410)  评论(0编辑  收藏  举报

Hanlp在离线环境下的安装我是没有尝试过的,分享SunJW_2017的这篇文章就是关于如何在离线环境下安装hanlp的。我们可以一起来学习一下!

HanLP是一款优秀的中文自然语言处理工具,可以实现包括分词、词性标注、实体识别在内容诸多功能,详情见其项目主页。另外,该工具包还提供了python3的接口,在线安装很方便,但有时需要部署在内网机等没有网络环境的机器上,比较繁琐,整理步骤如下:

 

1、安装jpype1,这是pyhanlp的依赖包,可以下载编译好的.whl文件,地址在这,选择对应自己python版本和操作系统版本的后,用pip install *.whl进行安装即可。

2、安装java环境,由于HanLP是用java开发的,因此调用python的接口时机器上应该配置了java环境,可以在网上搜索安装。

3、pyhanlp的项目主页下载完整的.zip压缩包,解压后进入文件夹执行python setup.py install。

4、下载data-for-1.7.0.zip和hanlp-1.7.0.-release.zip,解压后分别获得data文件夹和hanlp.properties、hanlp-1.7.0.jar文件。

5、进入python包的安装目录,以Anaconda为例,进入该安装目录下的./lib/site-packages/pyhanlp-0.1.44-py3.6.egg/pyhanlp文件夹,将4中得到的文件复制到本目录,保证目录的内部结构如下:

hanlp

|—static

|  |—data

|  |  |—dictionary

|  |  |—model

|  |  |—READ.html

|  |  |—version.txt

|  |—init.py

|  |—hanlp.properties

|  |—hanlp.properties.in

|  |—hanlp-1.7.0.jar

|  |—index.html

|—init.py

|—main.py

|—server.py

|—util.py

6、编辑hanlp.properties中的内容,更改其中root=行的内容,使其指向data文件夹的上一层,如root=D:/Anaconda/Lib/site-packages/pyhanlp-0.1.44-py3.6.egg/pyhanlp/static。

7、打开命令行,输入hanlp -v,检查是否安装成功。正常应该返回jar包、data文件夹和hanlp.properties的位置。

---------------------