摘要: 转自:http://www.dataguru.cn/thread-341168-1-1.html 流式实时分布式计算系统在互联网公司占有举足轻重的地位,尤其在在线和近线的海量数据处理上。而处理这些海量数据的,就是实时流式计算系统。Spark是实时计算的系统,支持流式计算,批处理和实时查询。除了... 阅读全文
posted @ 2016-01-16 22:53 五三中 阅读(3532) 评论(0) 推荐(0) 编辑
摘要: 转自:http://xumingming.sinaapp.com/127/twitter-storm如何保证消息不丢失/   storm保证从spout发出的每个tuple都会被完全处理。这篇文章介绍storm是怎么做到这个保证的,以及我们使用者怎么做才能充分利用storm的可靠性特点。 就如同蝴蝶 阅读全文
posted @ 2016-01-16 19:58 五三中 阅读(756) 评论(0) 推荐(0) 编辑