flume知识学习
面试要点
flume是分布式日志收集系统
flume的event
event将传输的数据进行封装,是flume传输数据的基本单位,也是事务的基本单位。包括event header、event body、event 信息。
flume的agent
agent本身就是一个java进程,包含三个组件:source->channel->sink ,类似生产者、仓库、消费者。
其中channel是把采集到的数据进行缓存,可以有三个地方:jdbc、memory、file;一般推荐用file
-----------专注于实时数仓,大数据存储、计算