快速了解ELK日志分析系统
摘要
顾名思义ELK是由Elasticsearch,Logstash,Kibana三大组件构成的一个基于web页面的日志分析工具。
日志分析是运维工程师解决系统故障,发现问题的主要手段。日志包含多种类型,包括程序日志,系统日志以及安全日志等。通过对日志分析,预发故障的发生,又可以在故障发生时,寻找到蛛丝马迹,快速定位故障点。及时解决。
组件结构:
- Elasticsearch:是一个开源分布式时实分析搜索引擎,建立在全文搜索引擎库Apache Lucene基础上,同时隐藏了Apache Lucene的复杂性。Elasticsearch将所有的功能打包成一个独立的动画片,索引副本机制,RESTful风格接口,多数据源。自动搜索等特点。
- Logstash :是一个完全开源的工具,主要用于日志收集,同时可以对数据处理,并输出给Elasticarch
- Kibana:也是一个完全开源的工具,kibana可以为Logstash和Elasticsearch提供图形化的日志分析。Web界面,可以汇总,分析和搜索重要数据日志。
一、ELK日志分析系统简介
1.1、日志服务器
1.1.1、提高安全性
1.1.2、集中存放日志
1.1.3、缺陷
对日志的分析困难
1.2、ELK日志分析系统
1.2.1、Elasticsearch
1.2.2、Logstash
1.2.3、Kibana
1.3、日志处理步骤
1.3.1、将日志进行集中化管理
1.3.2、将日志格式化(Logstash)并输出到(Elasticsearch)
1.3.3、对格式化后的数据进行索引和存储(Elasticsearch)
1.3.4、前端数据的展示(Kibana)
二、ELK组件介绍
2.1、ELasticsearch的概述
- 提供了一个分布式多用户能力的全文搜索引擎
2.2、Elasticsearch核心概念
2.2.1、接近实时
- elasticsearch是一个接近实时的搜索平台,这意味着,从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟(通常是1秒)
2.2.2、集群
- 一个集群就是由一个或多个节点组织在一起,它们共同持有你整个的数据,并一起提供索引和搜索功能。其中一个节点为主节点,这个主节点是可以通过选举产生的,并提供跨节点的联合索引和搜索的功能。集群有一个唯一性标示的名字,默认是elasticsearch,集群名字很重要,每个节点是基于集群名字加入到其集群中的。因此,确保在不同环境中使用不同的集群名字。一个集群可以只有一个节点。强烈建议在配置elasticsearch时,配置成集群模式。
2.2.3、节点
- 节点就是一台单一的服务器,是集群的一部分,存储数据并参与集群的索引和搜索功能。像集群一样,节点也是通过名字来标识,默认是在节点启动时随机分配的字符名。当然,你可以自己定义。该名字也很重要,在集群中用于识别服务器对应的节点。节点可以通过指定集群名字来加入到集群中。默认情况,每个节点被设置成加入到elasticsearch集群。如果启动了多个节点,假设能自动发现对方,他们将会自动组建一个名为elasticsearch的集群。
2.2.4、索引
- 索引(库)→类型(表)→文档(记录)
2.2.5、分片和副本
- 在实际情况下,索引存储的数据可能超过单个节点的硬件限制。如一个10亿文档需1TB空间可能不适合存储在单个节点的磁盘上,或者从单个节点搜索请求太慢了。为了解决这个问题,elasticsearch提供将索引分成多个分片的功能。当在创建索引时,可以定义想要分片的数量。每一个分片就是一个全功能的独立的索引,可以位于集群中任何节点上。
- 每个索引可以被分成多个分片。一个索引也可以被复制0次(意思是没有复制)或多次。一旦复制了,每个索引就有了主分片(作为复制源的原来的分片)和复制分片(主分片的拷贝)之别。分片和副本的数量可以在索引创建的时候指定。
- 在索引创建之后,你可以在任何时候动态地改变副本的数量,但是你事后不能改变分片的数量。
默认情况下,Elasticsearch中的每个索引被分片5个主分片和1个副本,这意味着,如果你的集群中至少有两个节点,你的索引将会有5个主分片和另外5个副本分片(1个完全拷贝),这样的话每个索引总共就有10个分片。
2.3、Logstash介绍
2.3.1、Logstash介绍
- 一款强大的数据处理工具
- 可实现数据传输、格式处理、格式化输出
- 数据输入、数据加工(如过滤,改写等)以及数据输出
2.3.2、Logstash主要组件
- Shipper:日志收集者,负责监控本地日志文件的变化,及时把日志文件的最新内容收集起来。通常,远程代理端(agent)只需要运行这个组件即可
- Indexer:日志存储者,负责接收日志并写入到本地文件
- Broker:日志hub,负责连接多个shipper和多个indexer
- Search and Storage:允许对事件进行搜索和存储
- Web Interface:基于Web的展示界面
2.4、Kibana介绍
2.4.1、Kibana介绍
- 一个针对Elasticsearch的开源分析及可视化平台
- 搜索、查看存储在Elasticsearch索引中的数据
- 通过各种图表进行高级数据分析及展示
2.4.2、Kibana主要功能
- Elasticsearch无缝之集成
- 整合数据,复杂数据分析
- 让更多团队成员受益
- 接口灵活,分享更容易
- 配置简单,可视化多数据源
- 简单数据导出
三、ELK日志问及那系部署
3.1、环境说明
部署两台Elasticsearch做集群,node1做ELK日志分析系统
apache |
20.0.0.30 |
httpd |
Logstash |
||
node1 |
20.0.0.10 |
Elasticsearch |
Kinaba |
||
node2 |
20.0.0.20 |
Elasticsearch |
3.2、Elasticsearch配置(下面的操作都需要在node1、node2上配置)
3.2.1、安装密钥及elasticsearch源
1 [root@node1 ~]# rpm --import https://packages.elastic.co/GPG-KEY-elasticsearch
2 [root@node1 ~]# cd /etc/yum.repos.d/
3 [root@node1 yum.repos.d]# vi elasticsearch.repo
4 [elasticsearch-2.x]
5 name=Elasticsearch repository for 2.x packages
6 baseurl=http://packages.elastic.co/elasticsearch/2.x/centos
7 gpgcheck=1
8 gpgkey=http://packages.elastic.co/GPG-KEY-elasticsearch
9 enable=1
10
11 [root@node1 ~]# yum list #查看yum清单
12 [root@node1 ~]# yum install elasticsearch -y #安装elasticsearch
13 [root@node1 ~]# yum install java -y #安装Java
14 [root@node1 ~]# java -version #查看Java版本
15 openjdk version "1.8.0_131"
16 OpenJDK Runtime Environment (build 1.8.0_131-b12)
17 OpenJDK 64-Bit Server VM (build 25.131-b12, mixed mode)
3.2.2、修改配置文件
1 [root@node1 yum.repos.d]# vi /etc/elasticsearch/elasticsearch.yml
2 17行 集群名称
3 cluster.name: elastic
4
5 23行 节点名称
6 node.name: linux-node1
7
8 33行 工作目录
9 path.data: /data/es-data
10 path.logs: /var/log/elasticsearch/
11
12 43行 防止交换swap分区
13 bootstrap.memory_lock: true
14
15 54行 监听网络
16 network.host: 0.0.0.0
17
18 58行 端口
19 http.port: 9200
3.2.3、创建目录及开启服务
1 [root@node1 yum.repos.d]# mkdir -p /data/es-data
2 [root@node1 yum.repos.d]# chown -R elasticsearch:elasticsearch /data/es-data
3 [root@node1 yum.repos.d]# systemctl start elasticsearch.service
4 [root@node1 yum.repos.d]# netstat -anpt | grep 9200
5 tcp6 0 0 :::9200 :::* LISTEN 54134/java
3.2.4、测试
1 http://20.0.0.10:9200
1 [root@node1 yum.repos.d]# curl -i -XGET 'http://20.0.0.20:9200/_count?pretty' -d '{
2 > "query": {
3 > "match_all": {}
4 > }
5 > }'
6 HTTP/1.1 200 OK #输出项
7 Content-Type: application/json; charset=UTF-8
8 Content-Length: 95
9
10 {
11 "count" : 0,
12 "_shards" : {
13 "total" : 0,
14 "successful" : 0,
15 "failed" : 0
16 }
17 }
18
19 [root@node2 yum.repos.d]# curl -i -XGET 'http://20.0.0.10:9200/_count?pretty' -d '{
20 > "query": {
21 > "match_all": {}
22 > }
23 > }'
24 HTTP/1.1 200 OK #输出项
25 Content-Type: application/json; charset=UTF-8
26 Content-Length: 95
27
28 {
29 "count" : 0,
30 "_shards" : {
31 "total" : 0,
32 "successful" : 0,
33 "failed" : 0
34 }
35 }
3.2.5、安装Elasticsearch插件
1 [root@node1 yum.repos.d]# /usr/share/elasticsearch/bin/plugin install mobz/elasticsearch-head
3.2.6、测试
1 http://20.0.0.10:9200/_plugin/head/
3.2.7、符合查询
- 提交请求
- 查询
- 删除后再查询
3.2.8、elasticsearch集群部署
1 [root@node1 yum.repos.d]# vi /etc/elasticsearch/elasticsearch.yml
2 69行 单播列表自动发现机制
3 discovery.zen.ping.unicast.hosts: ["20.0.0.10", "20.0.0.20"]
4
5 重启服务
6 [root@node1 yum.repos.d]# systemctl restart elasticsearch.service
3.2.9、测试
1 http://20.0.0.10:9200/_plugin/head/
3.2.10、node-01和node-02日志提示不让锁内存
1 [root@node1 elasticsearch]# less /var/log/elasticsearch/elastic.log
2 ......
3 [2020-11-18 10:36:42,959][WARN ][bootstrap ] These can be adjusted by modifying /etc/security/limits.conf, for example:
4 # allow user 'elasticsearch' mlockall
5 elasticsearch soft memlock unlimited
6 elasticsearch hard memlock unlimited
1 修改配置文件
2 [root@node1 elasticsearch]# vi /etc/security/limits.conf
3 //末尾插入
4 # allow user 'elasticsearch' mlockall
5 elasticsearch soft memlock unlimited
6 elasticsearch hard memlock unlimited
7
8 [root@node1 elasticsearch]# systemctl stop elasticsearch.service
9 [root@node1 elasticsearch]# systemctl start elasticsearch.service
3.2.11、安装监控组件
1 [root@node1 elasticsearch]# /usr/share/elasticsearch/bin/plugin install lmenezes/elasticsearch-kopf
3.2.12、测试
3.3、Logstash部署(apache上部署)
3.3.1、安装httpd并开启服务
1 [root@apache ~]# yum -y install httpd
2 [root@apache ~]# systemctl start httpd
3 [root@apache ~]# netstat -anpt | grep httpd
4 tcp6 0 0 :::80 :::* LISTEN 15620/httpd
5 [root@apache ~]# echo '<h1>this is web!</h1>' > /var/www/html/index.html
6 [root@apache ~]# curl http://localhost
7 <h1>this is web!</h1>
3.3.2、安装密钥及Logstash源
1 [root@node1 elasticsearch]# rpm --import https://packages.elastic.co/GPG-KEY-elasticsearch
2 [root@node1 elasticsearch]# vi /etc/yum.repos.d/logstash.repo
3 [logstash-2.1]
4 name=Logstash repository for 2.1.x packages
5 baseurl=http://packages.elastic.co/logstash/2.1/centos
6 gpgcheck=1
7 gpgkey=http://packages.elastic.co/GPG-KEY-elasticsearch
8 enable=1
9
10 安装Logstash
11 [root@node1 elasticsearch]# yum install logstash -y
3.3.3、安装java环境,没有自带安装使用yum -y install java安装
1 [root@apache ~]# yum -y install java 2 [root@apache ~]# java -version 3 openjdk version "1.8.0_131" 4 OpenJDK Runtime Environment (build 1.8.0_131-b12) 5 OpenJDK 64-Bit Server VM (build 25.131-b12, mixed mode)
6 [root@apache bin]# ln -s /opt/logstash/bin/logstash /usr/local/bin/
3.3.4、logstash(apache)与elasticsearch(node)功能是否正常,做对接测试
1 [root@apache bin]# logstash -e 'input { stdin{} } output { stdout{} }'
2 Settings: Default filter workers: 1
3 Logstash startup completed
4 www.baidu.com #随便输入几个网址
5 2020-11-18T07:53:59.480Z apache www.baidu.com
6 www.163.com
7 2020-11-18T07:54:12.187Z apache www.163.com
8 www.aliyun.com
9 2020-11-18T07:54:36.980Z apache www.aliyun.com
1 logstash命令选项解释:
2 -f:指定logstash的配置文件,根据配置文件配置logstash
3 -e:后面跟着字符串,该字符串可以被当做logstash的配置(如果是“ ”,则默认使用stdin做输入,stdout为输出)
4 -t:测试配置文件是否正确,然后退出
5 #输入采用标准输入,输出采用标准输出
3.3.5、使用rubydebug显示详细输出,codec为一种编解码器
1 [root@apache bin]# logstash -e 'input { stdin{} } output { stdout{ codec => rubydebug } }'
2 Settings: Default filter workers: 1
3 Logstash startup completed
4 www.baidu.com
5 {
6 "message" => "www.baidu.com",
7 "@version" => "1",
8 "@timestamp" => "2020-11-18T08:40:57.598Z",
9 "host" => "apache"
10 }
3.3.6、使用logstash将信息输出给elasticsearch
1 [root@apache bin]# logstash -e 'input { stdin{} } output { elasticsearch { hosts => ["20.0.0.10:9200"] } }'
2 Settings: Default filter workers: 1
3 Logstash startup completed
4 abc123 #输入内容
5 tom456
6 123jerry
3.3.7、打开浏览器输入http://20.0.0.10:9200/_plugin/head/,查看索引信息,显示新的数据信息说明输出到elasticsearch成功
3.3.8、在apache主机中做对接配置,logstash收集系统日志
1 logstash配置文件主要由三部分组成:input、output、filter
2 [root@apache bin]# chmod o+r /var/log/messages #允许其他用户访问
3 [root@apache bin]# ll /var/log/messages
4 -rw----r--. 1 root root 250721 11月 18 16:40 /var/log/message
5
6 [root@apache ~]# vi /etc/logstash/conf.d/system.conf
7 input { #logstash输入:从/var/log/messages输入,类型为system,起始位 置为从头开始
8 file {
9 path => "/var/log/messages"
10 type => "system"
11 start_position => "beginning"
12 }
13 }
14
15 output { #logstash输出:输出给elasticsearch(以IP地址指定位置)
16 elasticsearch {
17 hosts => ["20.0.0.10:9200"]
18 index => "system-%{+YYY.MM.dd}"
19 }
20 }
21
22 [root@apache ~]# systemctl restart logstash.service
3.3.9、打开浏览器输入http://20.0.0.10:9200/_plugin/dead/,查看索引信息,显示新的索引信息代表logstash搜集到的日志信息成功输出给elasticsearch
3.4、在node1主机安装kibana
3.4.1、在node1主机安装kibana
1 上传kibana-4.3.1-linux-x64.tar.gz到/root下
2 [root@node1 ~]# tar zxf kibana-4.3.1-linux-x64.tar.gz
3 [root@node1 ~]# mv kibana-4.3.1-linux-x64 kibana
4 [root@node1 ~]# mv kibana /usr/local/
5 [root@node1 ~]# cd /usr/local/kibana/
6 [root@node1 kibana]# vi config/kibana.yml
7
8 //2行 kibana打开的端口
9 server.port: 5601
10
11 //5行 kibana侦听的地址
12 server.host: "0.0.0.0"
13
14
15 //12行 和elasticsearch建立联系
16 elasticsearch.url: "http://20.0.0.10:9200"
17
18 //20行 在elasticsearch中添加.kibana索引
19 kibana.index: ".kibana"
20
21 [root@node1 kibana]# yum -y install screen
22
23 启动kibana
24 [root@node1 kibana]# /usr/local/kibana/bin/kibana
25 log [17:53:46.904] [info][status][plugin:kibana] Status changed from uninitialized to green - Ready
26 log [17:53:46.933] [info][status][plugin:elasticsearch] Status changed from uninitialized to yellow - Waiting for Elasticsearch
27 log [17:53:46.944] [info][status][plugin:kbn_vislib_vis_types] Status changed from uninitialized to green - Ready
28 log [17:53:46.951] [info][status][plugin:markdown_vis] Status changed from uninitialized to green - Ready
29 log [17:53:46.955] [info][status][plugin:metric_vis] Status changed from uninitialized to green - Ready
30 log [17:53:46.958] [info][status][plugin:spyModes] Status changed from uninitialized to green - Ready
31 log [17:53:46.966] [info][status][plugin:statusPage] Status changed from uninitialized to green - Ready
32 log [17:53:46.969] [info][status][plugin:table_vis] Status changed from uninitialized to green - Ready
33 log [17:53:46.978] [info][listening] Server running at http://0.0.0.0:5601
34 log [17:53:51.976] [info][status][plugin:elasticsearch] Status changed from yellow to yellow - No existing Kibana index found
35 log [17:53:54.602] [info][status][plugin:elasticsearch] Status changed from yellow to green - Kibana index ready
3.4.2、浏览器中登录20.0.0.10:5601,首次登录提示创建一个索引名字:
填入system-*,即对接系统日志文件名
3.4.3、同时也能看到刚才在kibana.yml中添加的在elasticsearch中添加.kibana索引配置生效了(用于验证kibana和elasticsearch是否成功连接)
3.4.4、添加logstash配置,收集apache服务的访问日志和错误日志中的数据
1 [root@apache ~]# cd /etc/logstash/conf.d/
2 [root@apache conf.d]# vi apache_log.conf
3 input {
4 file {
5 path => "/etc/httpd/logs/access_log"
6 type => "access"
7 start_position => "beginning"
8 }
9
10 file {
11 path => "/etc/httpd/logs/error_log"
12 type => "error"
13 start_position => "beginning"
14 }
15 }
16 output {
17 if [type] == "access" {
18 elasticsearch {
19 hosts => ["20.0.0.10:9200"]
20 index => "apache_access-%{+YYY.MM.dd}"
21 }
22 }
23 if [type] == "error" {
24 elasticsearch {
25 hosts => ["20.0.0.10:9200"]
26 index => "apache_error-%{+YYY.MM.dd}"
27 }
28 }
29 }
30
31 [root@apache conf.d]# logstash -f apache_log.conf #指定logstash的配置文件,根据apache_log.conf配置logstash(-f可以不重启加载)
3.4.5、浏览器访问http://20.0.0.10:9200/_plugin/head/,查看apache日志文件的索引是否建立成功
总结
ELK日志分析系统是一款非常强大的日志分析工具,能够帮助运维工程师更快更准确的定位到想要的日志,特别是kibana可视化工具,功能强大,使用起来非常人性化