流式计算storm应用场景简介

(1) storm是一个进程常驻内存的、分布式的,对数据实时流式处理框架,不同于MR的批处理和spark streaming的微批处理,storm实现了对数据处理的毫秒级延迟。它的数据源被称为SPOUT,数据处理流程被称为BOLT

(2)storm一般应用于对数据的处理速度特别高的场景。比如金融行业,毫秒级延迟的需求至关重要。一些需要实时处理数据的场景也可以应用Storm,比如根据用户行为产生的日志文件进行实时分析,对用户进行商品的实时推荐等。
posted @ 2016-10-14 22:30  yuerspring  阅读(1226)  评论(0编辑  收藏  举报