摘要: 1. 背景介绍 许多公司的平台每天会产生大量的日志(一般为流式数据,如,搜索引擎的pv,查询等),处理这些日志需要特定的日志系统,一般而言,这些系统需要具有以下特征: (1) 构建应用系统和分析系统的桥梁,并将它们之间的关联解耦; (2) 支持近实时的在线分析系统和类似于Hadoop之类的... 阅读全文
posted @ 2015-05-15 17:21 唐僧吃肉 阅读(239) 评论(0) 推荐(0) 编辑
摘要: 摘要: (1)kafka和flume都是日志系统。kafka是分布式消息中间件,自带存储,提供push和pull存取数据功能。flume分为agent(数据采集器),collector(数据简单处理和写入),storage(存储器)三部分,每一部分都是可以定制的。比如agent采用RPC(Th... 阅读全文
posted @ 2015-05-15 17:20 唐僧吃肉 阅读(259) 评论(0) 推荐(0) 编辑