摘要: kafka采用了一些非主流(unconventional)并经过实践的设计使其高效和可扩展。在实际使用中kafka显示出了相对于常见流行的消息系统的优越性。并且每天能够处理上百GB的新的数据。类似收集实时数据来获得查询、推荐、广告方感兴趣的内容时,需要计算大量细粒度的点击率,还包括那些没有点击的页面... 阅读全文
posted @ 2015-05-01 23:31 苦逼码农2014 阅读(649) 评论(0) 推荐(0) 编辑
摘要: Flume-ngFlume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 Flume的文档可以看http://flume.apache.org/FlumeUserGuide.html官方的英文文档 介绍的比较全面。 不过这里写写自己的见解这个是flume的架构图从上图可以看到几个名词... 阅读全文
posted @ 2015-05-01 23:13 苦逼码农2014 阅读(431) 评论(0) 推荐(0) 编辑