大数据之—Flume环境搭建
前言
参考:https://blog.csdn.net/huxili2020/article/details/120212162?spm=1001.2014.3001.5502
软件仓库:https://archive.apache.org/dist/flume/
软件:https://archive.apache.org/dist/flume/1.7.0/apache-flume-1.7.0-bin.tar.gz
一、安装
mkdir -p /opt/flume
mv apache-flume-1.7.0-bin.tar.gz /opt/flume/
tar -zxf /opt/flume/apache-flume-1.7.0-bin.tar.gz
二、配置
cp /opt/flume/apache-flume-1.7.0-bin/conf/flume-env.sh.template /opt/flume/apache-flume-1.7.0-bin/conf/flume-env.sh
vim /opt/flume/apache-flume-1.7.0-bin/conf/flume-env.sh
# export JAVA_HOME=/opt/jdk/java8
二、简单使用示例
yum install -y nc netcat
mkdir -p /opt/flume/job && cd /opt/flume/job
vim /opt/flume/job/netcat-flume-logger.conf
# 给代理上的组件命名 a1:表示agent的名称
# r1:表示a1的Source的名称
a1.sources = r1
# k1:表示a1的Sink的名称
a1.sinks = k1
# c1: 表示a1的Channel的名称
a1.channels = c1
# 描述/配置源
# 表示a1的输入源类型为netcat端口类型
a1.sources.r1.type = netcat
# 表示a1的监听的主机
a1.sources.r1.bind = localhost
# 表示a1的监听的端口号
a1.sources.r1.port = 44444
# 描述接收器
# 表示a1的输出目的地是控制台logger类型
a1.sinks.k1.type = logger
# 使用在内存中缓冲事件的通道
# 表示a1的channel类型是memory内存型
a1.channels.c1.type = memory
# 表示a1的channel总容量为1000个event
a1.channels.c1.capacity = 1000
# 表示a1的channel传输时收集到了100条event以后再去提交事务
a1.channels.c1.transactionCapacity = 100
# 将 source 和 sink 绑定到 channel
# 表示将r1和c1连接起来
a1.sources.r1.channels = c1
# 表示将k1和c1连接起来
a1.sinks.k1.channel = c1
测试-输出到控制台
/opt/flume/apache-flume-1.7.0-bin/bin/flume-ng agent --conf /opt/flume/apache-flume-1.7.0-bin/conf/ --name a1 --conf-file /opt/flume/job/netcat-flume-logger.conf -Dflume.root.logger=INFO,console