快速了解ELK日志分析系统

摘要

顾名思义ELK是由Elasticsearch，Logstash，Kibana三大组件构成的一个基于web页面的日志分析工具。

日志分析是运维工程师解决系统故障，发现问题的主要手段。日志包含多种类型，包括程序日志，系统日志以及安全日志等。通过对日志分析，预发故障的发生，又可以在故障发生时，寻找到蛛丝马迹，快速定位故障点。及时解决。

组件结构：

Elasticsearch：是一个开源分布式时实分析搜索引擎，建立在全文搜索引擎库Apache Lucene基础上，同时隐藏了Apache Lucene的复杂性。Elasticsearch将所有的功能打包成一个独立的动画片，索引副本机制，RESTful风格接口，多数据源。自动搜索等特点。
Logstash ：是一个完全开源的工具，主要用于日志收集，同时可以对数据处理，并输出给Elasticarch
Kibana：也是一个完全开源的工具，kibana可以为Logstash和Elasticsearch提供图形化的日志分析。Web界面，可以汇总，分析和搜索重要数据日志。

一、ELK日志分析系统简介

1.1、日志服务器

1.1.1、提高安全性

1.1.2、集中存放日志

1.1.3、缺陷

对日志的分析困难

1.2、ELK日志分析系统

1.2.1、Elasticsearch

1.2.2、Logstash

1.2.3、Kibana

1.3、日志处理步骤

1.3.1、将日志进行集中化管理

1.3.2、将日志格式化（Logstash）并输出到（Elasticsearch）

1.3.3、对格式化后的数据进行索引和存储（Elasticsearch）

1.3.4、前端数据的展示（Kibana）

二、ELK组件介绍

2.1、ELasticsearch的概述

提供了一个分布式多用户能力的全文搜索引擎

2.2、Elasticsearch核心概念

2.2.1、接近实时

elasticsearch是一个接近实时的搜索平台，这意味着，从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟（通常是1秒）

2.2.2、集群

一个集群就是由一个或多个节点组织在一起，它们共同持有你整个的数据，并一起提供索引和搜索功能。其中一个节点为主节点，这个主节点是可以通过选举产生的，并提供跨节点的联合索引和搜索的功能。集群有一个唯一性标示的名字，默认是elasticsearch，集群名字很重要，每个节点是基于集群名字加入到其集群中的。因此，确保在不同环境中使用不同的集群名字。一个集群可以只有一个节点。强烈建议在配置elasticsearch时，配置成集群模式。

2.2.3、节点

节点就是一台单一的服务器，是集群的一部分，存储数据并参与集群的索引和搜索功能。像集群一样，节点也是通过名字来标识，默认是在节点启动时随机分配的字符名。当然，你可以自己定义。该名字也很重要，在集群中用于识别服务器对应的节点。节点可以通过指定集群名字来加入到集群中。默认情况，每个节点被设置成加入到elasticsearch集群。如果启动了多个节点，假设能自动发现对方，他们将会自动组建一个名为elasticsearch的集群。

2.2.4、索引

索引（库）→类型（表）→文档（记录）

2.2.5、分片和副本

在实际情况下，索引存储的数据可能超过单个节点的硬件限制。如一个10亿文档需1TB空间可能不适合存储在单个节点的磁盘上，或者从单个节点搜索请求太慢了。为了解决这个问题，elasticsearch提供将索引分成多个分片的功能。当在创建索引时，可以定义想要分片的数量。每一个分片就是一个全功能的独立的索引，可以位于集群中任何节点上。
每个索引可以被分成多个分片。一个索引也可以被复制0次（意思是没有复制）或多次。一旦复制了，每个索引就有了主分片（作为复制源的原来的分片）和复制分片（主分片的拷贝）之别。分片和副本的数量可以在索引创建的时候指定。
在索引创建之后，你可以在任何时候动态地改变副本的数量，但是你事后不能改变分片的数量。
默认情况下，Elasticsearch中的每个索引被分片5个主分片和1个副本，这意味着，如果你的集群中至少有两个节点，你的索引将会有5个主分片和另外5个副本分片（1个完全拷贝），这样的话每个索引总共就有10个分片。

2.3、Logstash介绍

2.3.1、Logstash介绍

一款强大的数据处理工具
可实现数据传输、格式处理、格式化输出
数据输入、数据加工（如过滤，改写等）以及数据输出

2.3.2、Logstash主要组件

Shipper：日志收集者，负责监控本地日志文件的变化，及时把日志文件的最新内容收集起来。通常，远程代理端（agent）只需要运行这个组件即可
Indexer：日志存储者，负责接收日志并写入到本地文件
Broker：日志hub，负责连接多个shipper和多个indexer
Search and Storage：允许对事件进行搜索和存储
Web Interface：基于Web的展示界面

2.4、Kibana介绍

2.4.1、Kibana介绍

一个针对Elasticsearch的开源分析及可视化平台
搜索、查看存储在Elasticsearch索引中的数据
通过各种图表进行高级数据分析及展示

2.4.2、Kibana主要功能

Elasticsearch无缝之集成
整合数据，复杂数据分析
让更多团队成员受益
接口灵活，分享更容易
配置简单，可视化多数据源
简单数据导出

三、ELK日志问及那系部署

3.1、环境说明

部署两台Elasticsearch做集群，node1做ELK日志分析系统

apache	20.0.0.30	httpd
		Logstash
node1	20.0.0.10	Elasticsearch
		Kinaba
node2	20.0.0.20	Elasticsearch

3.2、Elasticsearch配置（下面的操作都需要在node1、node2上配置）

3.2.1、安装密钥及elasticsearch源

 1 [root@node1 ~]# rpm --import https://packages.elastic.co/GPG-KEY-elasticsearch
 2 [root@node1 ~]# cd /etc/yum.repos.d/
 3 [root@node1 yum.repos.d]# vi elasticsearch.repo
 4 [elasticsearch-2.x]
 5 name=Elasticsearch repository for 2.x packages
 6 baseurl=http://packages.elastic.co/elasticsearch/2.x/centos
 7 gpgcheck=1
 8 gpgkey=http://packages.elastic.co/GPG-KEY-elasticsearch
 9 enable=1
10 
11 [root@node1 ~]# yum list       #查看yum清单
12 [root@node1 ~]# yum install elasticsearch -y    #安装elasticsearch
13 [root@node1 ~]# yum install java -y      #安装Java
14 [root@node1 ~]# java -version           #查看Java版本
15 openjdk version "1.8.0_131"
16 OpenJDK Runtime Environment (build 1.8.0_131-b12)
17 OpenJDK 64-Bit Server VM (build 25.131-b12, mixed mode)

3.2.2、修改配置文件

 1 [root@node1 yum.repos.d]# vi /etc/elasticsearch/elasticsearch.yml 
 2 17行 集群名称
 3 cluster.name: elastic
 4 
 5 23行 节点名称
 6 node.name: linux-node1
 7 
 8 33行 工作目录
 9 path.data: /data/es-data
10 path.logs: /var/log/elasticsearch/
11 
12 43行 防止交换swap分区
13 bootstrap.memory_lock: true
14 
15 54行 监听网络
16 network.host: 0.0.0.0
17 
18 58行 端口
19 http.port: 9200

3.2.3、创建目录及开启服务

1 [root@node1 yum.repos.d]# mkdir -p /data/es-data
2 [root@node1 yum.repos.d]# chown -R elasticsearch:elasticsearch /data/es-data
3 [root@node1 yum.repos.d]# systemctl start elasticsearch.service 
4 [root@node1 yum.repos.d]# netstat -anpt | grep 9200
5 tcp6       0      0 :::9200                 :::*                    LISTEN      54134/java

3.2.4、测试

1 http://20.0.0.10:9200

 1 [root@node1 yum.repos.d]# curl -i -XGET 'http://20.0.0.20:9200/_count?pretty' -d '{
 2 > "query": {
 3 >     "match_all": {}
 4 > }
 5 > }'
 6 HTTP/1.1 200 OK       #输出项
 7 Content-Type: application/json; charset=UTF-8
 8 Content-Length: 95
 9 
10 {
11   "count" : 0,
12   "_shards" : {
13     "total" : 0,
14     "successful" : 0,
15     "failed" : 0
16   }
17 }
18 
19 [root@node2 yum.repos.d]# curl -i -XGET 'http://20.0.0.10:9200/_count?pretty' -d '{
20 > "query": {
21 >     "match_all": {}
22 > }
23 > }'
24 HTTP/1.1 200 OK      #输出项
25 Content-Type: application/json; charset=UTF-8
26 Content-Length: 95
27 
28 {
29   "count" : 0,
30   "_shards" : {
31     "total" : 0,
32     "successful" : 0,
33     "failed" : 0
34   }
35 }

3.2.5、安装Elasticsearch插件

1 [root@node1 yum.repos.d]# /usr/share/elasticsearch/bin/plugin install mobz/elasticsearch-head

3.2.6、测试

1 http://20.0.0.10:9200/_plugin/head/

3.2.7、符合查询

提交请求

查询

删除后再查询

3.2.8、elasticsearch集群部署

1 [root@node1 yum.repos.d]# vi /etc/elasticsearch/elasticsearch.yml
2 69行 单播列表自动发现机制
3 discovery.zen.ping.unicast.hosts: ["20.0.0.10", "20.0.0.20"]
4 
5 重启服务
6 [root@node1 yum.repos.d]# systemctl restart elasticsearch.service

3.2.9、测试

1 http://20.0.0.10:9200/_plugin/head/

3.2.10、node-01和node-02日志提示不让锁内存

1 [root@node1 elasticsearch]# less /var/log/elasticsearch/elastic.log
2 ......
3 [2020-11-18 10:36:42,959][WARN ][bootstrap                ] These can be adjusted by modifying /etc/security/limits.conf, for example: 
4         # allow user 'elasticsearch' mlockall
5         elasticsearch soft memlock unlimited
6         elasticsearch hard memlock unlimited

1 修改配置文件
2 [root@node1 elasticsearch]# vi /etc/security/limits.conf 
3 //末尾插入
4 # allow user 'elasticsearch' mlockall
5 elasticsearch soft memlock unlimited
6 elasticsearch hard memlock unlimited
7 
8 [root@node1 elasticsearch]# systemctl stop elasticsearch.service 
9 [root@node1 elasticsearch]# systemctl start elasticsearch.service

3.2.11、安装监控组件

1 [root@node1 elasticsearch]# /usr/share/elasticsearch/bin/plugin install lmenezes/elasticsearch-kopf

3.2.12、测试

3.3、Logstash部署（apache上部署）

3.3.1、安装httpd并开启服务

1 [root@apache ~]# yum -y install httpd 
2 [root@apache ~]# systemctl start httpd
3 [root@apache ~]# netstat -anpt | grep httpd
4 tcp6       0      0 :::80                   :::*                    LISTEN      15620/httpd         
5 [root@apache ~]# echo '<h1>this is web!</h1>' > /var/www/html/index.html
6 [root@apache ~]# curl http://localhost
7 <h1>this is web!</h1>

3.3.2、安装密钥及Logstash源

 1 [root@node1 elasticsearch]# rpm --import https://packages.elastic.co/GPG-KEY-elasticsearch
 2 [root@node1 elasticsearch]# vi /etc/yum.repos.d/logstash.repo
 3 [logstash-2.1]
 4 name=Logstash repository for 2.1.x packages
 5 baseurl=http://packages.elastic.co/logstash/2.1/centos
 6 gpgcheck=1
 7 gpgkey=http://packages.elastic.co/GPG-KEY-elasticsearch
 8 enable=1
 9 
10 安装Logstash
11 [root@node1 elasticsearch]# yum install logstash -y

3.3.3、安装java环境，没有自带安装使用yum -y install java安装

1 [root@apache ~]# yum -y install java
2 [root@apache ~]# java -version
3 openjdk version "1.8.0_131"
4 OpenJDK Runtime Environment (build 1.8.0_131-b12)
5 OpenJDK 64-Bit Server VM (build 25.131-b12, mixed mode)
6 [root@apache bin]# ln -s /opt/logstash/bin/logstash /usr/local/bin/

3.3.4、logstash（apache）与elasticsearch（node）功能是否正常，做对接测试

1 [root@apache bin]# logstash -e 'input { stdin{} } output { stdout{} }'
2 Settings: Default filter workers: 1
3 Logstash startup completed
4 www.baidu.com                       #随便输入几个网址
5 2020-11-18T07:53:59.480Z apache www.baidu.com
6 www.163.com  
7 2020-11-18T07:54:12.187Z apache www.163.com
8 www.aliyun.com     
9 2020-11-18T07:54:36.980Z apache www.aliyun.com

1 logstash命令选项解释：
2 -f：指定logstash的配置文件，根据配置文件配置logstash
3 -e：后面跟着字符串，该字符串可以被当做logstash的配置（如果是“ ”，则默认使用stdin做输入，stdout为输出）
4 -t：测试配置文件是否正确，然后退出
5 #输入采用标准输入，输出采用标准输出

3.3.5、使用rubydebug显示详细输出，codec为一种编解码器

 1 [root@apache bin]# logstash -e 'input { stdin{} } output { stdout{ codec => rubydebug } }'
 2 Settings: Default filter workers: 1
 3 Logstash startup completed
 4 www.baidu.com
 5 {
 6        "message" => "www.baidu.com",
 7       "@version" => "1",
 8     "@timestamp" => "2020-11-18T08:40:57.598Z",
 9           "host" => "apache"
10 }

3.3.6、使用logstash将信息输出给elasticsearch

1 [root@apache bin]# logstash -e 'input { stdin{} } output { elasticsearch { hosts => ["20.0.0.10:9200"] } }'
2 Settings: Default filter workers: 1
3 Logstash startup completed
4 abc123      #输入内容
5 tom456
6 123jerry

3.3.7、打开浏览器输入http://20.0.0.10:9200/_plugin/head/，查看索引信息，显示新的数据信息说明输出到elasticsearch成功

3.3.8、在apache主机中做对接配置,logstash收集系统日志

 1 logstash配置文件主要由三部分组成：input、output、filter
 2 [root@apache bin]# chmod o+r /var/log/messages   #允许其他用户访问
 3 [root@apache bin]#  ll /var/log/messages
 4 -rw----r--. 1 root root 250721 11月 18 16:40 /var/log/message
 5 
 6 [root@apache ~]# vi /etc/logstash/conf.d/system.conf
 7 input {                    #logstash输入：从/var/log/messages输入，类型为system，起始位                     置为从头开始
 8         file {
 9           path => "/var/log/messages"
10           type => "system"
11           start_position => "beginning"
12         }
13       }
14 
15 output {                #logstash输出：输出给elasticsearch（以IP地址指定位置）
16         elasticsearch {
17         hosts => ["20.0.0.10:9200"]
18         index => "system-%{+YYY.MM.dd}"
19         }
20       }
21 
22 [root@apache ~]# systemctl restart logstash.service

3.3.9、打开浏览器输入http://20.0.0.10:9200/_plugin/dead/，查看索引信息，显示新的索引信息代表logstash搜集到的日志信息成功输出给elasticsearch

3.4、在node1主机安装kibana

3.4.1、在node1主机安装kibana

 1 上传kibana-4.3.1-linux-x64.tar.gz到/root下
 2 [root@node1 ~]# tar zxf kibana-4.3.1-linux-x64.tar.gz 
 3 [root@node1 ~]# mv kibana-4.3.1-linux-x64 kibana
 4 [root@node1 ~]# mv kibana /usr/local/
 5 [root@node1 ~]# cd /usr/local/kibana/
 6 [root@node1 kibana]# vi config/kibana.yml 
 7 
 8 //2行 kibana打开的端口
 9 server.port: 5601     
10 
11 //5行 kibana侦听的地址
12 server.host: "0.0.0.0"
13 
14 
15 //12行 和elasticsearch建立联系
16 elasticsearch.url: "http://20.0.0.10:9200"
17 
18 //20行 在elasticsearch中添加.kibana索引
19 kibana.index: ".kibana"
20 
21 [root@node1 kibana]# yum -y install screen
22 
23 启动kibana
24 [root@node1 kibana]# /usr/local/kibana/bin/kibana
25   log   [17:53:46.904] [info][status][plugin:kibana] Status changed from uninitialized to green - Ready
26   log   [17:53:46.933] [info][status][plugin:elasticsearch] Status changed from uninitialized to yellow - Waiting for Elasticsearch
27   log   [17:53:46.944] [info][status][plugin:kbn_vislib_vis_types] Status changed from uninitialized to green - Ready
28   log   [17:53:46.951] [info][status][plugin:markdown_vis] Status changed from uninitialized to green - Ready
29   log   [17:53:46.955] [info][status][plugin:metric_vis] Status changed from uninitialized to green - Ready
30   log   [17:53:46.958] [info][status][plugin:spyModes] Status changed from uninitialized to green - Ready
31   log   [17:53:46.966] [info][status][plugin:statusPage] Status changed from uninitialized to green - Ready
32   log   [17:53:46.969] [info][status][plugin:table_vis] Status changed from uninitialized to green - Ready
33   log   [17:53:46.978] [info][listening] Server running at http://0.0.0.0:5601
34   log   [17:53:51.976] [info][status][plugin:elasticsearch] Status changed from yellow to yellow - No existing Kibana index found
35   log   [17:53:54.602] [info][status][plugin:elasticsearch] Status changed from yellow to green - Kibana index ready

3.4.2、浏览器中登录20.0.0.10:5601，首次登录提示创建一个索引名字：
填入system-*，即对接系统日志文件名

3.4.3、同时也能看到刚才在kibana.yml中添加的在elasticsearch中添加.kibana索引配置生效了（用于验证kibana和elasticsearch是否成功连接）

3.4.4、添加logstash配置，收集apache服务的访问日志和错误日志中的数据

 1 [root@apache ~]# cd /etc/logstash/conf.d/
 2 [root@apache conf.d]# vi apache_log.conf
 3 input {
 4         file {
 5           path => "/etc/httpd/logs/access_log"
 6           type => "access"
 7           start_position => "beginning"
 8         }
 9 
10         file {
11           path => "/etc/httpd/logs/error_log"
12           type => "error"
13           start_position => "beginning"
14         }
15    }
16 output {
17         if [type] == "access" {
18           elasticsearch {
19             hosts => ["20.0.0.10:9200"]
20             index => "apache_access-%{+YYY.MM.dd}"
21           }
22         }
23         if [type] == "error" {
24           elasticsearch {
25             hosts => ["20.0.0.10:9200"]
26             index => "apache_error-%{+YYY.MM.dd}"
27           }
28         }
29     }
30 
31 [root@apache conf.d]# logstash -f apache_log.conf    #指定logstash的配置文件，根据apache_log.conf配置logstash（-f可以不重启加载）

3.4.5、浏览器访问http://20.0.0.10:9200/_plugin/head/，查看apache日志文件的索引是否建立成功

总结

ELK日志分析系统是一款非常强大的日志分析工具，能够帮助运维工程师更快更准确的定位到想要的日志，特别是kibana可视化工具，功能强大，使用起来非常人性化

posted @ 2020-11-18 08:20 yy1299050947 阅读(536) 评论(0) 编辑收藏举报

刷新页面返回顶部

徐豪