2015 年 8月 23 日随笔档案 - 一人浅醉-

2015年8月23日

摘要：我们为什么要搭建该系统 Kafka是一个消息系统，原本开发自LinkedIn，用作LinkedIn的活动流（activity stream）和运营数据处理管道（pipeline）的基础。现在它已为多家不同类型的公司作为多种类型的数据管道（data pipeline）和消息系统使用。活动流数据是所阅读全文

posted @ 2015-08-23 11:00 一人浅醉- 阅读(487) 评论(0) 推荐(0) 编辑

Apache Kafka开发入门指南(2)

摘要： Apache Kafka目标是统一离线和在线处理，与Flume和Scribe相比较，Kafka在处理活动流数据方面更具优势。但是从架构的视野来看，Kafka与传统的消息系统（例如ActiveMQ或RabbitMQ）更相似一些。注：Scribe是Facebook开源的日志收集系统，在Facebook 阅读全文

posted @ 2015-08-23 10:59 一人浅醉- 阅读(271) 评论(0) 推荐(0) 编辑

Apache Kafka开发入门指南(1)

摘要： Apache Kafka可以帮助你解决在发布/订阅架构中遇到消费数百万消息的问题。如今，商业应用、社交应用以及其它类型的应用产生的实时信息在不断增长，这些信息需要以简单的方式快速、可靠地路由到各种类型的接收者。在大多数情况下，产生信息和消费信息的应用都是自然分开的，彼此不可互相访问。需要一种机制，让阅读全文

posted @ 2015-08-23 10:58 一人浅醉- 阅读(263) 评论(0) 推荐(0) 编辑

使用Storm实现实时大数据分析

摘要：摘要：随着数据体积的越来越大，实时处理成为了许多机构需要面对的首要挑战。Shruthi Kumar和Siddharth Patankar在Dr.Dobb’s上结合了汽车超速监视，为我们演示了使用Storm进行实时大数据分析。CSDN在此编译、整理。简单和明了，Storm让大数据分析变得轻松加愉快。阅读全文

posted @ 2015-08-23 10:55 一人浅醉- 阅读(751) 评论(0) 推荐(0) 编辑

实时计算storm流程架构总结

摘要： hadoop一般用在离线的分析计算中，而storm区别于hadoop，用在实时的流式计算中，被广泛用来进行实时日志处理、实时统计、实时风控等场景，当然也可以用在对数据进行实时初步的加工，存储到分布式数据库中如HBase，便于后续的查询。面对的大批量的数据的实时计算，storm实现了一个可扩展的、低阅读全文

posted @ 2015-08-23 10:54 一人浅醉- 阅读(535) 评论(0) 推荐(0) 编辑

一人浅醉-

技术改变命运~

公告