linux 安装ElasticSearch的中文分词器IK

首先确保ElasticSearch镜像已经启动

一定要保证ElasticSearch和ElasticSearch插件的版本一致

我是用的是ElasticSearch是6.5.4版本 对应elasticsearch-analysis-ik-6.5.4

IK与ES版本兼容 ,详情请参考https://github.com/medcl/elasticsearch-analysis-ik

 

方式一:在线安装

进入容器

docker exec -it elasticsearch /bin/bash

在线下载并安装

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.5.4/elasticsearch-analysis-ik-6.5.4.zip

进入plugins可以看到IK分词器已经安装成功

方式二:离线安装

下载地址:

https://github.com/medcl/elasticsearch-analysis-ik/releases

将IK分词器上传到/tmp目录中

将压缩包移动到容器中

docker cp /tmp/elasticsearch-analysis-ik-6.5.4.zip elasticsearch:/usr/share/elasticsearch/plugins

进入容器

docker exec -it elasticsearch /bin/bash

创建目录

mkdir /usr/share/elasticsearch/plugins/ik

将文件压缩包移动到ik中

mv /usr/share/elasticsearch/plugins/elasticsearch-analysis-ik-6.5.4.zip /usr/share/elasticsearch/plugins/ik

进入目录

cd /usr/share/elasticsearch/plugins/ik

解压

unzip elasticsearch-analysis-ik-6.5.4.zip

删除压缩包

rm -rf elasticsearch-analysis-ik-6.5.4.zip

退出并重启镜像

exit
docker restart elasticsearch

 

elasticsearch 默认的分词器,对中文是按照单个汉字,分词的。 

例:

 

 

 IK 分词器的使用
例:可以进行词语的分割,这就更符合我们中文的查询习惯。

 

 

 ik分词器的使用不止这些。还可以自定义词条,以及添加自定义词条,或者忽略某些词条。
此外还有起的的分词器,可以根据自己项目的实际需要,来进行操作。

posted @   一个人的孤独自白  阅读(1917)  评论(0编辑  收藏  举报
编辑推荐:
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
点击右上角即可分享
微信分享提示