elasticsearch中文分词器ik-analyzer安装

  前面我们介绍了Centos安装elasticsearch 6.4.2 教程,elasticsearch内置的分词器对中文不友好,只会一个字一个字的分,无法形成词语,别急,已经有大拿把中文分词器做好了,elasticsearch配套的ik-analyzer,我们一起来看看如何安装吧。

  我们到ik-analyzer中文分词器开源项目查找与elasticsearch对应的v6.4.2版本(有的是6.0.0版https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.0.0/elasticsearch-analysis-ik-6.0.0.zip) https://github.com/medcl/elasticsearch-analysis-ik/releases

ik-analyzer中文分词器v6.4.2

  复制ik-analyzer中文分词器v6.4.2的链接地址,进行安装

1
/usr/share/elasticsearch/bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.4.2/elasticsearch-analysis-ik-6.4.2.zip

安装ik-analyzer中文分词器v6.4.2

  安装完成,重新启动一下elasticsearch

1
sudo systemctl restart elasticsearch

  查看一下ik-analyzer的效果

1
curl -H 'Content-Type: application/json'  -XGET 'localhost:9200/_analyze?pretty' -d '{"analyzer":"ik_max_word","text":"ytkah博客园"}'

验证ik-analyzer的效果

  博客这个词是不是没有被分成“博”和“客”两个字了?说明已经安装成功

  本文参考https://baijunyao.com/article/155

posted @   ytkah  阅读(3082)  评论(0编辑  收藏  举报
编辑推荐:
· .NET Core GC压缩(compact_phase)底层原理浅谈
· 现代计算机视觉入门之:什么是图片特征编码
· .NET 9 new features-C#13新的锁类型和语义
· Linux系统下SQL Server数据库镜像配置全流程详解
· 现代计算机视觉入门之:什么是视频
阅读排行:
· Sdcb Chats 技术博客:数据库 ID 选型的曲折之路 - 从 Guid 到自增 ID,再到
· .NET Core GC压缩(compact_phase)底层原理浅谈
· Winform-耗时操作导致界面渲染滞后
· Phi小模型开发教程:C#使用本地模型Phi视觉模型分析图像,实现图片分类、搜索等功能
· 语音处理 开源项目 EchoSharp
历史上的今天:
2015-11-05 如何进行网站统计分析?分8步走!
2013-11-05 wordpress注册后重定向到自定义页面
2013-11-05 WordPress 3.8 后台仪表盘将重新设计
2013-11-05 初来咋到,欢迎吐槽
网址导航 gg N / G Sitemap

部分内容来源于网络,如有版权问题请联系删除

  
点击右上角即可分享
微信分享提示