大数据之—Flume环境搭建

前言

参考:https://blog.csdn.net/huxili2020/article/details/120212162?spm=1001.2014.3001.5502

软件仓库:https://archive.apache.org/dist/flume/

软件:https://archive.apache.org/dist/flume/1.7.0/apache-flume-1.7.0-bin.tar.gz

一、安装

mkdir -p /opt/flume

mv apache-flume-1.7.0-bin.tar.gz /opt/flume/

tar -zxf /opt/flume/apache-flume-1.7.0-bin.tar.gz

二、配置

cp /opt/flume/apache-flume-1.7.0-bin/conf/flume-env.sh.template /opt/flume/apache-flume-1.7.0-bin/conf/flume-env.sh

vim /opt/flume/apache-flume-1.7.0-bin/conf/flume-env.sh
# export JAVA_HOME=/opt/jdk/java8

二、简单使用示例

yum install -y nc netcat
mkdir -p /opt/flume/job && cd /opt/flume/job

vim /opt/flume/job/netcat-flume-logger.conf

# 给代理上的组件命名  a1:表示agent的名称
# r1:表示a1的Source的名称
a1.sources = r1
# k1:表示a1的Sink的名称
a1.sinks = k1
# c1: 表示a1的Channel的名称
a1.channels = c1

# 描述/配置源
# 表示a1的输入源类型为netcat端口类型
a1.sources.r1.type = netcat
# 表示a1的监听的主机
a1.sources.r1.bind = localhost
# 表示a1的监听的端口号
a1.sources.r1.port = 44444

# 描述接收器
# 表示a1的输出目的地是控制台logger类型
a1.sinks.k1.type = logger

# 使用在内存中缓冲事件的通道
# 表示a1的channel类型是memory内存型
a1.channels.c1.type = memory
# 表示a1的channel总容量为1000个event
a1.channels.c1.capacity = 1000
# 表示a1的channel传输时收集到了100条event以后再去提交事务
a1.channels.c1.transactionCapacity = 100

# 将 source 和 sink 绑定到 channel
# 表示将r1和c1连接起来
a1.sources.r1.channels = c1
# 表示将k1和c1连接起来
a1.sinks.k1.channel = c1

测试-输出到控制台

/opt/flume/apache-flume-1.7.0-bin/bin/flume-ng agent --conf /opt/flume/apache-flume-1.7.0-bin/conf/ --name a1 --conf-file /opt/flume/job/netcat-flume-logger.conf -Dflume.root.logger=INFO,console

posted @     阅读(20)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· Obsidian + DeepSeek:免费 AI 助力你的知识管理,让你的笔记飞起来!
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
历史上的今天:
2022-03-22 自建SSL证书
2022-03-22 IntelliJ IDEA 使用sftp快速同步web项目到服务器
2022-03-22 web项目与jsp有关的三个jar的依赖
点击右上角即可分享
微信分享提示