摘要: #Flume 进阶 ##1.Flume事务 数据输入端 : source分为两种:主动拉取:Spooldir Source Taildir Source 被动推动:Exec source netcat source put事务阶段: source 会采集到批量之后才会执行put事务流程, do co 阅读全文
posted @ 2021-01-27 23:05 triumph丶xs 阅读(149) 评论(0) 推荐(0) 编辑
摘要: #Flume概述 ##1.Flume概述 Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。 Flume适用于各种数据采集的场景,减少代码的书写 如果不采用flume,针对不同的应用场景都需要编写客户端,代码量比较大, 阅读全文
posted @ 2021-01-27 22:24 triumph丶xs 阅读(129) 评论(0) 推荐(0) 编辑