ElasticSearch5.0+版本分词热更新实践记录
前言
刚开始接触ElasticSearch的时候,版本才是2.3.4,短短的时间,现在都更新到5.0+版本了。分词和head插件好像用法也不一样了,本博客记录如何配置Elasticsearch的Head插件和使用ik分词并进行热更新。
实践记录
首先安装ES5.3.2版本,之前安装了5.4版本,奈何分词版本只更新到5.3.2,于是又换回了5.3.2的版本,不过没关系。ik分词也会更新。由于Head插件不和以前的用法一样,所以,这里记录一下如何在5.0版本以后使用Head插件。
可参考文章 http://blog.csdn.net/yx1214442120/article/details/55102298
安装nodejs环境,安装grunt,安装好grunt之后,要在elasticsearch.yml中增加配置:
http.cors.enabled: true http.cors.allow-origin: "*"
其他配置修改,参考上文链接中的内容。我们先用grunt server命令运行head插件
在浏览器中打开该地址可以看到相应的管理界面:
安装IK分词很简单,从该地址(https://github.com/medcl/elasticsearch-analysis-ik/releases)下载相对应的版本即可,可以直接将下载后的源代码生成的jar包,放在plugins/ik/下。
ik分词的配置中是可以远程加载词库的,此时新建一个web项目代表远程词库,例如我的词库地址为:
修改ik分词的配置即可,配置文件路径:D:\ElasticSearch\plugins\ik\config
当我们启动ES的时候会看到相应的日志记录,如下:
这个远程词库,IK会定期检查,如果变化,会重新加载。由于汉字中是乱码,所以,我新加一个英文的词newword。可以看到,已经重新加载了远程词库。
下面测试一下分词效果 http://localhost:9200/cnblogs1/_analyze?analyzer=ik_smart&text=侯亮平,远程词库中没有【侯亮平】,此时解析出是这样的:
由于词库是延迟更新的,所以添加完词之后,不会立马变化。等一会,重新加载之后可以看分词效果:
这样我们的词库热更新就完成啦。小伙伴们赶紧去试试吧。