IK分词器
在线安装ik插件(较慢)
点击查看代码
# 进入容器内部
docker exec -it elasticsearch /bin/bash
# 在线下载并安装
./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.12.1.zip
#退出
exit
#重启容器
docker restart elasticsearch
离线安装ik插件
安装插件需要知道elasticsearch的plugins目录位置,而我们用了数据卷挂载,因此需要查看elasticsearch的数据卷目录,通过下面命令查看:
docker volume inspect es-plugins
显示结果:
说明plugins目录被挂载到了:/var/lib/docker/volumes/es-plugins/_data这个目录中。
解压缩分词器安装包,上传到es容器的插件数据卷中。也就是/var/lib/docker/volumes/es-plugins/_data。
重启容器。
扩展词词典
随着互联网的发展,“造词运动”也越发的频繁。出现了很多新的词语,在原有的词汇列表中并不存在。比如:“原神”,“op” 等。
所以我们的词汇也需要不断的更新,IK分词器提供了扩展词汇的功能。
-
打开IK分词器config目录
-
在IKAnalyzer.cfg.xml配置文件内容添加:
-
新建一个 ext.dic,在该文件中添加新词。可以参考config目录下复制一个配置文件进行修改。
-
重启elasticsearch
停用词词典
- IKAnalyzer.cfg.xml配置文件内容添加:
- 在 stopword.dic 添加停用词
- 重启elasticsearch,kibana
IK分词器的几种模式:
- ik_smart:智能切分,粗粒度
- ik_max_word:最细切分,细粒度
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配,妙~啊~