摘要: 一、storm是一个用于实时流式计算的分布式计算引擎,弥补了Hadoop在实时计算方面的不足(Hadoop在本质上是一个批处理系统)。 二、storm在实际应用场景中的位置一般如下: 其中的编号1~5说明如下: 1、Flume用于收集日志信息; 2、结合数据传输功能可以把收集到的日志信息实时传输到k 阅读全文
posted @ 2017-01-22 14:44 hadoop_dev 阅读(3021) 评论(0) 推荐(1) 编辑