ELK之八----Logstash结合kafka收集系统日志和nginx日志

一、logstash结合kafka收集系统日志和nginx日志

架构图:

环境准备:

A主机:kibana、elasticsearch,有条件可以将两个服务器分开:192.168.7.100

B主机:logstash主机:192.168.7.101/nginx服务器也在此主机上

C主机:logstash主机:192.168.7.102

D主机:kafka/zookeeper:192.168.7.104

E主机:kafka/zookeeper:192.168.7.105

1、使用logstash-B主机收集系统日志和nginx日志写入kafka

1、我们在搭建完kafka及zookeeper的基础上,选择提取zookeeper的leader的主机进行存储

[root@tomcat-web2 ~]# /usr/local/zookeeper/bin/zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/local/zookeeper/bin/../conf/zoo.cfg
Mode: leader  # 查看到192.168.7.105主机是leader模式

2、在logstash主机/etc/logstash/conf.d/目录下创建收集系统日志和nginx日志的文件

[root@logstash-1 conf.d]# cat log-to-kafka.conf 
input {
  file {
    path => "/var/log/messages"
    type => "kafka-syslog-log-7-101" # 定义系统日志类型
    start_position => "beginning"
    stat_interval => "2"
  }

  file {
    path => "/var/log/nginx/access.log"
    type => "kafka-nginx-access-log-7-101" # 定义nginx的日志类型
    start_position => "beginning"
    stat_interval => "2"
    codec => "json"  # 如果是json格式的日志,必须写入json格式
  }
}

output {
 if [type] == "kafka-syslog-log-7-101" {
    kafka {
      topic_id => "kafka-syslog-log-7-101"
      bootstrap_servers => "192.168.7.105:9092"  # 指定写入到kafka的leader主机的IP地址上
      codec => "json" # 写入的时候使用json编码,因为logstash收集后会转换为json格式
    }
  file {
    path => "/tmp/syslog.log" # 将收集到的访问系统的日志临时存在此文件下,方便排错,解决问题后,可以删除此两项
   }}


 if [type] == "kafka-nginx-access-log-7-101" {
    kafka {
      topic_id => "kafka-nginx-access-log-7-101"
      bootstrap_servers => "192.168.7.105:9092" # 指定写入到kafka主机的IP地址
      codec => "json" # 写入的时候使用json编码,因为Logstash收集后会转换为json格式
    }
 file {
    path => "/tmp/nginx-access.log" # 临时先存放在此文件下,方便排错,如果没有错误,可以删除此项
   }}
}

2、验证logstash配置文件的正确性

[root@logstash-1 conf.d]# logstash -f log-to-kafka.conf

3、开始访问nginx网页,(192.168.7.101:80)再查看访问的临时log信息

 4、在logstash主机上测试系统日志访问情况

[root@logstash-1 ~]# echo 1 >> /var/log/messages
[root@logstash-1 ~]# echo 2 >> /var/log/messages
[root@logstash-1 ~]# echo 3 >> /var/log/messages 

5、查看此时的临时文件信息

 此时测试logstash收集到日志写入到kafka中正常,可以将测试的file部分脚本删除掉,然后启动logstash服务。

  file {
    path => "/tmp/syslog.log" # 删除掉两个测试部分
   }

 file {
    path => "/tmp/nginx-access.log"
   }

启动D主机的logstash服务。

# systemctl start logstash

2、配置logstash-C主机从kafka读取系统日志和nginx日志

1、在logstash-A主机的/etc/logstash/conf.d/目录下创建一个收集kafka配置文件

input {
   kafka {
      topics => "kafka-syslog-log-7-101"
      bootstrap_servers => "192.168.7.105:9092"  # 从kafka的leader主机上提取缓存
      codec => "json"  # 在提取kafka主机的日志时,需要写成json格式
   }

[root@logstash conf.d]# vim kafka-to-es_logstash.conf 
    kafka {
      topics => "kafka-nginx-access-log-7-101"
      bootstrap_servers => "192.168.7.105:9092" # 从kafka的leader主机提取数据
      codec => "json"  # 提取kafka日志时,需要写成json格式
   }

}



output {
  if [type] == "kafka-syslog-log-7-101" {  # 转到elasticsearch主机上
   elasticsearch {
      hosts => ["192.168.7.100:9200"]
      index => "kafka-syslog-7-101-%{+YYYY.ww}" # YYYY代表年,ww代表周
    }}

  if [type] == "kafka-nginx-access-log-7-101" {  # 转到elasticsearch主机上
   elasticsearch {
      hosts => ["192.168.7.100:9200"]
      index => "kafka-nginx-access-log-7-101-%{+YYYY.MM.dd}"
    }}
}

2、启动logstash-B主机的服务器

# systemctl start logstash

3、在head插件上查看收集到的信息,已经收集到了syslog和nginx的log

3、在kibana网页上创建索引

1、在kibana创建索引

2、在discover查看nginx日志信息

3、在logstash-D主机的系统日志中输入信息,在discover查看系统日志信息

[root@logstash-1 conf.d]# echo  1 >> /var/log/messages
[root@logstash-1 conf.d]# echo  2 >> /var/log/messages
[root@logstash-1 conf.d]# echo  3 >> /var/log/messages

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  

posted @ 2020-03-23 08:07  一叶知秋~~  阅读(1882)  评论(0编辑  收藏  举报