摘要: 定义: Flume:是Cloudera提供的一个分布式的海量日志采集、聚合和传输的系统; Kafka:是一种高吞吐量的分布式发布订阅消息系统; 各特点: 场景: Flume主要是和HDFS\HBase结合,有特殊优化效率更好; Kafka 是一个通用型系统,开发商 Cloudera 推荐如果数据需要 阅读全文
posted @ 2017-07-06 09:41 mzzcy 阅读(2612) 评论(0) 推荐(0) 编辑
摘要: The ChainMapper class allows to use multiple Mapper classes within a single Map task. The ChainReducer class allows to chain multiple Mapper classes a 阅读全文
posted @ 2017-07-06 01:14 mzzcy 阅读(253) 评论(0) 推荐(0) 编辑