【ELK】【docker】【elasticsearch】2.使用elasticSearch+kibana+logstash+ik分词器+pinyin分词器+繁简体转化分词器 6.5.4 启动 ELK+logstash概念描述

官网地址：https://www.elastic.co/guide/en/elasticsearch/reference/current/docker.html#docker-cli-run-prod-mode

1.拉取镜像

docker pull elasticsearch:6.5.4

docker pull kibana:6.5.4

2.启动容器

docker run  -d --name es1  -p 9200:9200 -p 9300:9300 --restart=always -e "discovery.type=single-node" elasticsearch:6.5.4

docker run -d  -p 5601:5601 --name kibana --restart=always --link es1:elasticsearch  kibana:6.5.4

如果启动ES仅是测试使用，启用单节点即可。

如果启动ES是要给生产任务使用，需要启动ES集群。ES 6.5.4启动集群文章

3.访问地址

http://192.168.92.130:5601/status

4.安装ik分词器

进入es容器

sudo docker exec -it es1 /bin/bash

进入plugins目录

cd plugins/

下载对应es版本的ik的压缩包【安装插件的版本需要与es版本一致】

wget http://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.5.4/elasticsearch-analysis-ik-6.5.4.zip

创建ik目录，用于存放解压ik压缩包的文件

mkdir elasticsearch-analysis-ik

解压ik压缩包到指定目录

unzip elasticsearch-analysis-ik-6.5.4.zip -d elasticsearch-analysis-ik

删除源压缩包

rm -f elasticsearch-analysis-ik-6.5.4.zip

exit 退出容器重启es容器查看启动日志加载插件信息

exit

docker restart es1

docker logs -f es1

验证ik分词器是否安装成功【analyzer参数值：ik_max_word 如果未安装成功，请求就会报错！】

两种粗细粒度分别为：

　　ik_max_word

　　ik_smart

POST     http://192.168.92.130:9200/_analyze

请求体：

{
    "analyzer":"ik_max_word",
    "text":"德玛西亚之力在北韩打倒了变形金刚"
}

结果:

{
    "tokens": [
        {
            "token": "德",
            "start_offset": 0,
            "end_offset": 1,
            "type": "CN_CHAR",
            "position": 0
        },
        {
            "token": "玛",
            "start_offset": 1,
            "end_offset": 2,
            "type": "CN_CHAR",
            "position": 1
        },
        {
            "token": "西亚",
            "start_offset": 2,
            "end_offset": 4,
            "type": "CN_WORD",
            "position": 2
        },
        {
            "token": "之力",
            "start_offset": 4,
            "end_offset": 6,
            "type": "CN_WORD",
            "position": 3
        },
        {
            "token": "在",
            "start_offset": 6,
            "end_offset": 7,
            "type": "CN_CHAR",
            "position": 4
        },
        {
            "token": "北韩",
            "start_offset": 7,
            "end_offset": 9,
            "type": "CN_WORD",
            "position": 5
        },
        {
            "token": "打倒",
            "start_offset": 9,
            "end_offset": 11,
            "type": "CN_WORD",
            "position": 6
        },
        {
            "token": "倒了",
            "start_offset": 10,
            "end_offset": 12,
            "type": "CN_WORD",
            "position": 7
        },
        {
            "token": "变形金刚",
            "start_offset": 12,
            "end_offset": 16,
            "type": "CN_WORD",
            "position": 8
        },
        {
            "token": "变形",
            "start_offset": 12,
            "end_offset": 14,
            "type": "CN_WORD",
            "position": 9
        },
        {
            "token": "金刚",
            "start_offset": 14,
            "end_offset": 16,
            "type": "CN_WORD",
            "position": 10
        }
    ]
}

View Code

ik分词器成功安装

附加一个：

查看某个index下某个type中的某条document的某个属性的属性值分词效果：

格式如下：

你的index/你的type/document的id/_termvectors?fields=${字段名}

http://192.168.92.130:9200/swapping/builder/6/_termvectors?fields=buildName

【注意fields参数对应的是数组】

5.安装pinyin分词器

进入容器

sudo docker exec -it es1 /bin/bash

进入插件目录

cd plugins/

创建目录elasticsearch-analysis-pinyin

mkdir elasticsearch-analysis-pinyin

进入目录elasticsearch-analysis-pinyin，下载pinyin分词器压缩包【注意版本和es版本一致】

cd elasticsearch-analysis-pinyin/

wget https://github.com/medcl/elasticsearch-analysis-pinyin/releases/download/v6.5.4/elasticsearch-analysis-pinyin-6.5.4.zip

解压压缩包，解压完成删除压缩包

unzip elasticsearch-analysis-pinyin-6.5.4.zip

rm -f elasticsearch-analysis-pinyin-6.5.4.zip

退出容器，重启es,查看日志

exit

docker restart es1

docker logs -f es1

验证pinyin分词器是否安装成功

结果：

{
    "tokens": [
        {
            "token": "de",
            "start_offset": 0,
            "end_offset": 0,
            "type": "word",
            "position": 0
        },
        {
            "token": "dmxyzlzbhddlbxjg",
            "start_offset": 0,
            "end_offset": 0,
            "type": "word",
            "position": 0
        },
        {
            "token": "ma",
            "start_offset": 0,
            "end_offset": 0,
            "type": "word",
            "position": 1
        },
        {
            "token": "xi",
            "start_offset": 0,
            "end_offset": 0,
            "type": "word",
            "position": 2
        },
        {
            "token": "ya",
            "start_offset": 0,
            "end_offset": 0,
            "type": "word",
            "position": 3
        },
        {
            "token": "zhi",
            "start_offset": 0,
            "end_offset": 0,
            "type": "word",
            "position": 4
        },
        {
            "token": "li",
            "start_offset": 0,
            "end_offset": 0,
            "type": "word",
            "position": 5
        },
        {
            "token": "zai",
            "start_offset": 0,
            "end_offset": 0,
            "type": "word",
            "position": 6
        },
        {
            "token": "bei",
            "start_offset": 0,
            "end_offset": 0,
            "type": "word",
            "position": 7
        },
        {
            "token": "han",
            "start_offset": 0,
            "end_offset": 0,
            "type": "word",
            "position": 8
        },
        {
            "token": "da",
            "start_offset": 0,
            "end_offset": 0,
            "type": "word",
            "position": 9
        },
        {
            "token": "dao",
            "start_offset": 0,
            "end_offset": 0,
            "type": "word",
            "position": 10
        },
        {
            "token": "le",
            "start_offset": 0,
            "end_offset": 0,
            "type": "word",
            "position": 11
        },
        {
            "token": "bian",
            "start_offset": 0,
            "end_offset": 0,
            "type": "word",
            "position": 12
        },
        {
            "token": "xing",
            "start_offset": 0,
            "end_offset": 0,
            "type": "word",
            "position": 13
        },
        {
            "token": "jin",
            "start_offset": 0,
            "end_offset": 0,
            "type": "word",
            "position": 14
        },
        {
            "token": "gang",
            "start_offset": 0,
            "end_offset": 0,
            "type": "word",
            "position": 15
        }
    ]
}

View Code

证明pinyin插件安装成功

6.繁简体转化分词器

进入es容器

sudo docker exec -it es1 /bin/bash

进入plugins目录

cd plugins/

创建繁简体转化目录

mkdir elasticsearch-analysis-stconvert

进入目录

cd elasticsearch-analysis-stconvert/

下载插件压缩包

wget https://github.com/medcl/elasticsearch-analysis-stconvert/releases/download/v6.5.4/elasticsearch-analysis-stconvert-6.5.4.zip

解压压缩包

unzip elasticsearch-analysis-stconvert-6.5.4.zip

解压完成后，移除原压缩包

rm -f elasticsearch-analysis-stconvert-6.5.4.zip

退出容器

exit

重启es

docker restart es1

查看日志

检验繁简体转化是否安装成功

URL：POST

http://192.168.92.130:9200/_analyze

请求体：

{
  "analyzer":"stconvert",
  "text" : "国际电视台"
}

请求结果：

繁简体转化安装成功

7.安装启动logstash

docker拉取logstash

docker pull logstash:6.5.4

启动logstash

docker run -d -p 5044:5044 -p 9600:9600 --restart=always --name logstash logstash:6.5.4

查看日志

docker logs -f logstash

查看日志可以看出，虽然启动成功，但是并未连接上es,

这就需要修改logstash中的对接配置

进入logstash容器内

docker exec -it logstash /bin/bash

进入config目录

cd /usr/share/logstash/config/

修改logstash.yml文件中的es.url

vi logstash.yml

修改url为自己的es所在IP:port

退出容器，重启logstash

exit

docker restart logstash

查看日志可以看到启动成功并且es连接池中刚刚配置的连接地址已经连接成功

回到kibana，查看ELK状态以及运转情况

OK，ELK搭建完成！！！

=================================================附录=============================================================================

一、ELK概念描述

看到这里，有很多地方都是迷迷糊糊的吧。

这里简单一说：

ELK是一整套的分布式日志分析平台的解决方案。

在ELK【都是开源软件】中，

E代表 es，用于存储日志信息【就是一个开源可持久化的分布式全文搜索引擎】

L代表logstash，用于收集日志信息【开源数据收集引擎】

K代表kibana，用于展示日志信息【开源的分析和可视化平台】

二、关于logstash插件的知识

这里就要了解一些logstash的知识 logstash插件详解

而对于logstash的收集功能，其实是由它的一个一个插件完成的。而主体的三个插件配置就是input--->filter--->output，如下图所示。

其中input和output是必须的，而filter是非必须的。

input插件配置，是指定数据的输入源，配置标明要收集的数据是从什么地方来的。一个 pipeline是可以指定多个input插件的。

　　　　input可以是stdin、file、kafka

filter插件配置，是对原始数据进行类型转化、删除字段、格式化数据的。不是必须的配置。

　　　　filter可以是date、grok、dissect、mutate、json、geoip、ruby

output插件配置，是将数据输出到指定位置。

　　　　output可以是stdout、file、elasticsearch

====================================================================================================

posted @ 2019-01-03 14:20 Angel挤一挤阅读(3596) 评论(3) 编辑收藏举报

刷新页面返回顶部

Angel挤一挤