Elasticsearch 第一篇:在 Windows 上的环境搭建

      本文介绍如何在 windows 10 ,64位操作系统上安装最新版本 Elasticsearch、以及相关插件。之前看了不少园友的文章,用到的版本都比较低,尤其是插件的版本要和ES的版本相对应等这些问题,介绍的不是很详细,干脆自己记录一下安装配置过程,也供他人参考。

Elasticsearch简介

      Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。

配置 java 环境

      由于ES是Java语言开发的,所以这里需要先安装Java环境,jdk 下载地址是:

              https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

      下载时,需要先注册Oracle账号,注册后选择下载 Windows x 64 .exe 这个最新版本(目前是 2020年7月,版本是 jdk14 )

       

      双击 jdk-14_windows-x64-bin ,然后一直点击 “下一步” 按钮,直到安装完毕,默认的安装路径是  C:\Program Files\Java\jdk-14\   按照默认路径安装即可

      接下来,需要配置Java环境变量,右击 “我的电脑”  ——点击 “属性” ——点击 “高级系统设置”,如下图

      

 

      在新窗口的 “高级” 选项卡中,点击 “环境变量” ,再点击系统变量(S)里的 “新建” 按钮,弹出新窗口如下图所示

   

      变量名填入: JAVA_HOME        变量值填入安装的路径: C:\Program Files\Java\jdk-14  

      然后在系统变量(S)中,选中Path 这个变量,点击 “编辑” 按钮,打开编辑窗口,再点击 “新建” 按钮,输入 %JAVA_HOME%\bin 如下图所示

   

      最后验证一下配置是否成功,打开 cmd 窗口(以管理员形式打开),输入命令  java  -version  或者命令 javac 可以看安装是否成功,如下图

     

      以上说明安装成功,java 版本是14 

下载并安装 Elasticsearch

      ES工具包下载地址是:http://www.elasticsearch.org/download/

      我们选择版本 7.8.0 window 这个版本,先在D盘建一个 ES 目录(方便管理),将下载的包解压到 ES 目录中,如下图所示

      

      以管理员身份运行,打开cmd窗口,进入ES的bin目录:  cd /d D:\ES\elasticsearch-7.8.0\bin

      然后运行命令  elasticsearch.bat

      

      稍等片刻,然后在浏览器中访问 http://localhost:9200/

      

      以上说明 ES 相关包已经成功安装

安装Head插件

      安装 Head 插件的前提,是需要将 node、grunt 安装和配置完善。

1、首先下载 node.js

      下载地址是  https://nodejs.org/en/download/ 

      选择window 64位的版本 v12.18.1,一直点击 “下一步” 按钮,直到安装完毕,下载完成可以通过命令  node  -v   查看安装版本以及是否成功,如下图

            

2、安装grunt   

      以管理员身份打开cmd命令窗口,执行 npm install -g grunt-cli   然后通过  grunt -version  看安装的版本

           

3、下载 Head

      Head 相关文档   http://mobz.github.io/elasticsearch-head/ 

      或者直接到  https://github.com/mobz/elasticsearch-head 下载 zip 包到本地。请注意,上面ES安装的版本是 v.7.8.0 ,这里 Head 插件也要选择 master 这个版本下载。

      下载完,我们将其解压到上面提到的D盘ES目录,跟ES放在同一级目录,方便管理,如下图所示

           

      cmd 进入head 目录: cd /d D:\ES\elasticsearch-head-master

      然后执行命令:npm install  如下图所示

           

      上图执行过程卡住了,主要是缺少 phantomjs-2.1.1-windows ,按照上边的提示,先下载这个文件,

      然后放在目录 C:\Users\ADMINI~1\AppData\Local\Temp\phantomjs\phantomjs-2.1.1-windows.zip

      顺便解压一下,再重新试一下执行 npm install ,这次执行成功了,见下图

           

      然后执行 npm start ,启动 Head 插件,如下图所示

           

      再访问  http://localhost:9100 可以看到下图效果

           

      虽然Head已经是安装成功,但是目前是未连接状态,上网查一下资料,需要做以下配置:

      找到文件  D:\ES\elasticsearch-7.8.0\config\elasticsearch.yml   在该文件最后添加以下语句:

                   http.cors.enabled: true

                   http.cors.allow-origin: "*"

      然后再重启ES,重启Head:

                   重启ES             cd /d D:\ES\elasticsearch-7.8.0\bin\elasticsearch.bat

                   重启Head         cd /d D:\ES\elasticsearch-head-master\npm start

      再访问 http://localhost:9200/  以及  http://localhost:9100/ 

      这时可以看到,现在连接上了,灰色变成绿色,Head 安装成功。

      为什么要这样配置,可以参考文章  https://www.cnblogs.com/sanduzxcvbnm/p/11969634.html

            

      总结一下,Head 插件安装比较麻烦,但是通过看报错信息以及网上资料文档,多多尝试,是可以解决的。

安装 Kibana

      Kibana 插件是一个可视化的插件,非必须,如果需要安装也可以参考以下的流程

      下载地址是  https://www.elastic.co/cn/downloads/kibana

      注意,我们 用的ES版本是 v7.8.0 , Kibana 安装的版本也是要和ES的同步,这里选择 Kibana版本为 7.8.0

      同样,下载完毕后,我们将其解压到  D:\ES\kibana-7.8.0

      同样以管理员身份打开cmd 窗口执行命令

             cd /d D:\ES\kibana-7.8.0\bin

             kibana.bat

      执行完,能正常打开 http://localhost:5601 即成功,Kibana 要怎么用,以后再来详细说明。

安装分词器 IK

      ES默认的分词器,对中文的分解不是很好,所以需要用到其它分词器,这里以IK分词器为例,介绍怎么安装。

      首先往ES添加索引,用 postman 提交数据:

      put    http://localhost:9200/db_news/new/1   

      注意:这次提交,会自动创建索引库 db_news 并创建文档 type=new  id=1,其实在ES7版本中,已经弃用 type 的概念,实际上应该是  put   http://localhost:9200/db_news/_doc/1

      如果要查看ES创建的索引库 db_news 的结构,可以这样查询  get    http://localhost:9200/db_news/_mapping 后面的博客将会继续讲解 mapping,这里不再详细解说

{
    "title":"今日头条新闻",
    "author":"新华时报记者",
    "content":"今日券商股继续涨停"
}

      提交后可以看到返回结果

{
    "_index": "db_news",
    "_type": "new",
    "_id": "1",
    "_version": 1,
    "result": "created",
    "_shards": {
        "total": 2,
        "successful": 1,
        "failed": 0
    },
    "_seq_no": 0,
    "_primary_term": 1
}

      如果我们用ES原生的分词器,例如 

      get   http://localhost:9200/db_news/_analyze

 {
    "analyzer":"standard",
    "text":"我是中国人,我爱自己的祖国"
 }

      分词结果是

{
    "tokens": [
        {
            "token": "我",
            "start_offset": 0,
            "end_offset": 1,
            "type": "<IDEOGRAPHIC>",
            "position": 0
        },
        {
            "token": "是",
            "start_offset": 1,
            "end_offset": 2,
            "type": "<IDEOGRAPHIC>",
            "position": 1
        },
        {
            "token": "中",
            "start_offset": 2,
            "end_offset": 3,
            "type": "<IDEOGRAPHIC>",
            "position": 2
        },
        {
            "token": "国",
            "start_offset": 3,
            "end_offset": 4,
            "type": "<IDEOGRAPHIC>",
            "position": 3
        },
        {
            "token": "人",
            "start_offset": 4,
            "end_offset": 5,
            "type": "<IDEOGRAPHIC>",
            "position": 4
        },
        {
            "token": "我",
            "start_offset": 6,
            "end_offset": 7,
            "type": "<IDEOGRAPHIC>",
            "position": 5
        },
        {
            "token": "爱",
            "start_offset": 7,
            "end_offset": 8,
            "type": "<IDEOGRAPHIC>",
            "position": 6
        },
        {
            "token": "自",
            "start_offset": 8,
            "end_offset": 9,
            "type": "<IDEOGRAPHIC>",
            "position": 7
        },
        {
            "token": "己",
            "start_offset": 9,
            "end_offset": 10,
            "type": "<IDEOGRAPHIC>",
            "position": 8
        },
        {
            "token": "的",
            "start_offset": 10,
            "end_offset": 11,
            "type": "<IDEOGRAPHIC>",
            "position": 9
        },
        {
            "token": "祖",
            "start_offset": 11,
            "end_offset": 12,
            "type": "<IDEOGRAPHIC>",
            "position": 10
        },
        {
            "token": "国",
            "start_offset": 12,
            "end_offset": 13,
            "type": "<IDEOGRAPHIC>",
            "position": 11
        }
    ]
}

      显然,这样的分词毫无意义,这也是我们要安装IK分词器的原因。

      IK分词器下载地址   https://github.com/medcl/elasticsearch-analysis-ik   同样用 7.8.0 版本

      在 D:\ES\elasticsearch-7.8.0\plugins 新建 ik 文件夹,将以上下载的包解压到这里,如下图所示

       

      然后重启 ES,再进行IK分词测试

      Get  http://localhost:9200/db_news/_analyze

 {
    "analyzer":"ik_smart",
    "text":"我是中国人,我爱自己的祖国"
}

      返回分词结果是

{
    "tokens": [
        {
            "token": "我",
            "start_offset": 0,
            "end_offset": 1,
            "type": "CN_CHAR",
            "position": 0
        },
        {
            "token": "是",
            "start_offset": 1,
            "end_offset": 2,
            "type": "CN_CHAR",
            "position": 1
        },
        {
            "token": "中国人",
            "start_offset": 2,
            "end_offset": 5,
            "type": "CN_WORD",
            "position": 2
        },
        {
            "token": "我",
            "start_offset": 6,
            "end_offset": 7,
            "type": "CN_CHAR",
            "position": 3
        },
        {
            "token": "爱",
            "start_offset": 7,
            "end_offset": 8,
            "type": "CN_CHAR",
            "position": 4
        },
        {
            "token": "自己",
            "start_offset": 8,
            "end_offset": 10,
            "type": "CN_WORD",
            "position": 5
        },
        {
            "token": "的",
            "start_offset": 10,
            "end_offset": 11,
            "type": "CN_CHAR",
            "position": 6
        },
        {
            "token": "祖国",
            "start_offset": 11,
            "end_offset": 13,
            "type": "CN_WORD",
            "position": 7
        }
    ]
}

      可以看到,分词后不再是一个汉字分成一组,而是一个名词分成一组,这样方便我们进行关键词匹配和检索,具体用法可以看后续博文,至此,IK分词也安装成功。

本文关于环境搭建的过程,已经写得很详细了,关于ES的应用,可以看后续的更新。

总结

      启动 ES           cd /d D:\ES\elasticsearch-7.8.0\bin     再执行 elasticsearch.bat       访问  http://localhost:9200/

      启动Head        cd /d D:\ES\elasticsearch-head-master   再执行 npm start             访问  http://localhost:9100/

      启动Kibana      cd /d D:\ES\kibana-7.8.0\bin   再执行 kibana.bat                          访问  http://localhost:5601

      存在问题:以上我安装IK分词器后,直接重启ES,分词器马上生效,如果我换其它分词器,是不是也是直接重启ES就可以了呢?

                       还有,如果我原来就建立了索引库,更新分词器后,应该怎么处理原来的索引?知道的朋友可以评论一下。

 

posted @ 2020-07-13 16:18  vincentfhr方海荣  阅读(1051)  评论(3编辑  收藏  举报