elasticsearch中文分词器ik-analyzer安装
前面我们介绍了Centos安装elasticsearch 6.4.2 教程,elasticsearch内置的分词器对中文不友好,只会一个字一个字的分,无法形成词语,别急,已经有大拿把中文分词器做好了,elasticsearch配套的ik-analyzer,我们一起来看看如何安装吧。
我们到ik-analyzer中文分词器开源项目查找与elasticsearch对应的v6.4.2版本(有的是6.0.0版https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.0.0/elasticsearch-analysis-ik-6.0.0.zip) https://github.com/medcl/elasticsearch-analysis-ik/releases
复制ik-analyzer中文分词器v6.4.2的链接地址,进行安装
1 | /usr/share/elasticsearch/bin/elasticsearch-plugin install https: //github .com /medcl/elasticsearch-analysis-ik/releases/download/v6 .4.2 /elasticsearch-analysis-ik-6 .4.2.zip |
安装完成,重新启动一下elasticsearch
1 | sudo systemctl restart elasticsearch |
查看一下ik-analyzer的效果
1 | curl -H 'Content-Type: application/json' -XGET 'localhost:9200/_analyze?pretty' -d '{"analyzer":"ik_max_word","text":"ytkah博客园"}' |
博客这个词是不是没有被分成“博”和“客”两个字了?说明已经安装成功
本文参考https://baijunyao.com/article/155
加微信交流
标签:
Elasticsearch
, ik-analyzer
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· .NET Core GC压缩(compact_phase)底层原理浅谈
· 现代计算机视觉入门之:什么是图片特征编码
· .NET 9 new features-C#13新的锁类型和语义
· Linux系统下SQL Server数据库镜像配置全流程详解
· 现代计算机视觉入门之:什么是视频
· Sdcb Chats 技术博客:数据库 ID 选型的曲折之路 - 从 Guid 到自增 ID,再到
· .NET Core GC压缩(compact_phase)底层原理浅谈
· Winform-耗时操作导致界面渲染滞后
· Phi小模型开发教程:C#使用本地模型Phi视觉模型分析图像,实现图片分类、搜索等功能
· 语音处理 开源项目 EchoSharp
2015-11-05 如何进行网站统计分析?分8步走!
2013-11-05 wordpress注册后重定向到自定义页面
2013-11-05 WordPress 3.8 后台仪表盘将重新设计
2013-11-05 初来咋到,欢迎吐槽