摘要: 编译自官方文档 Apache Kafka是一个分布式消息发布订阅系统。它最初由LinkedIn公司基于独特的设计实现为一个分布式的提交日志系统( a distributed commit log),,之后成为Apache项目的一部分。Kafka系统快速、可扩展并且可持久化。它的分区特性,可复制和可容错都是其不错的特性。 Apache Kafka与传统消息系统相比,有以下不同: 它被设计为一个分布... 阅读全文
posted @ 2014-10-30 15:27 Gcoder 阅读(544) 评论(0) 推荐(0) 编辑
摘要: 1、 概述 Kafka是Linkedin于2010年12月份开源的消息系统,它主要用于处理活跃的流式数据。活跃的流式数据在web网站应用中非常常见,这些数据包括网站的pv、用户访问了什么内容,搜索了什么内容等。 这些数据通常以日志的形式记录下来,然后每隔一段时间进行一次统计处理。 传统的日志分析系统提供了一种离线处理日志信息的可扩展方案,但若要进行实时处理,通常会有较大延迟。而现有的消(队列)系... 阅读全文
posted @ 2014-10-30 15:04 Gcoder 阅读(577) 评论(0) 推荐(0) 编辑