Flume数据采集准备

 


  Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。

 

1.flume节点服务设计

 

 

 

2.下载Flume并安装

  1)下载Apache版本的Flume。

  2)下载Cloudera版本的Flume。

  3)这里选择下载Apache版本的apache-flume-1.7.0-bin.tar.gz ,然后上传至bigdata-pro01.kfk.com节点/opt/softwares/目录下

  4)解压Flume

[kfk@bigdata-pro01 softwares]$ tar -zxf apache-flume-1.7.0-bin.tar.gz -C ../modules/

[kfk@bigdata-pro01 softwares]$ cd ../modules/

[kfk@bigdata-pro01 modules]$ ls

apache-flume-1.7.0-bin  hadoop-2.6.0  hbase-0.98.6-cdh5.3.0  jdk1.8.0_60  kafka_2.11-0.8.2.1  zookeeper-3.4.5-cdh5.10.0

[kfk@bigdata-pro01 modules]$ mv apache-flume-1.7.0-bin/ flume-1.7.0-bin/

  5)将flume分发到其他两个节点

scp -r flume-1.7.0-bin bigdata-pro02.kfk.com:/opt/modules/

scp -r flume-1.7.0-bin bigdata-pro03.kfk.com:/opt/modules/

 

 

3.flume agent-1采集节点服务配置

 

1)bigdata-pro02.kfk.com节点配置flume,将数据采集到bigdata-pro01.kfk.com节点

  从notepad++新建一个连接到第二个节点,然后将conf下的所有文件进行重命名,去掉 .template后缀。

 

 

  先配置Java环境变量:

 

 

  然后配置flume-conf.properties文件,重点是对上面流程图中source、channel和sink三个线程进行配置。

  由于所给的模板配置不全,并且格式也有点乱,所有我们全部干掉,然后填入下面的内容。

 

agent2.sources = r1
agent2.channels = c1
agent2.sinks = k1

agent2.sources.r1.type = exec
agent2.sources.r1.command = tail -F /opt/datas/weblogs.log
agent2.sources.r1.channels = c1

agent2.channels.c1.type = memory
agent2.channels.c1.capacity = 10000
agent2.channels.c1.transactionCapacity = 10000
agent2.channels.c1.keep-alive = 5

agent2.sinks.k1.type = avro
agent2.sinks.k1.channel = c1
agent2.sinks.k1.hostname = bigdata-pro01.kfk.com
agent2.sinks.k1.port = 5555

  2号和3号节点负责对应用服务器的日志进行收集,使用它们的source是exec(命令行的标准输出),然后通过sink端(avro类型)推送给1号机器进行日志合并处理。如下图红框中所示:

 

 

  Flume官网给出的配置讲解也是非常的全面,大家可以去阅读以下,并且学会根据官网指南进行自定义的配置。

 

2)将以上配置发送到3号节点。

scp -r flume-1.7.0-bin/ bigdata-pro03.kfk.com:/opt/modules/

  然后将配置文件中的agent2全部改为agent3,以实现将数据采集到bigdata-pro01.kfk.com节点的功能。

  记得创建weblogs文件!

[kfk@bigdata-pro03 ~]$ cd /opt/datas/

[kfk@bigdata-pro03 datas]$ touch weblogs.log

[kfk@bigdata-pro03 datas]$ ls

weblogs.log

 

 


以上就是博主为大家介绍的这一板块的主要内容,这都是博主自己的学习过程,希望能给大家带来一定的指导作用,有用的还望大家点个支持,如果对你没用也望包涵,有错误烦请指出。如有期待可关注博主以第一时间获取更新哦,谢谢!同时也欢迎转载,但必须在博文明显位置标注原文地址,解释权归博主所有!

posted @ 2018-10-25 11:20  子墨言良  阅读(214)  评论(0编辑  收藏  举报