flume

flume数据采集

各种各样的数据源--》读数据,缓存数据,写数据--各种各样的目标存储系统

缓存数据:内存,本地磁盘文件

读数据:任何数据都封装成event对象;组件接口(source),根据各种数据源写source实现类

event:head{描述信息},body{数据}

写数据:组件接口(sink),根据目标存储系统写sink实现类

常用实现类已经写好,只用修改实现类的配置文件

flume工作机制:可以启动flume的agent程序进行数据采集,每个agent程序中包含三大组件:source,channel,sink,agent根据需要可以在多台机器上启动

posted @ 2019-08-13 16:38  寅狗  阅读(120)  评论(0编辑  收藏  举报