摘要: Flume:Flume是一个分布式,可依赖的,用于高效率的收集、聚类、移动大量数据的服务。Flume使用基于流数据的简单而且可扩展的架构。由于拥有可调的依赖机制和许多故障恢复机制,Flume是健壮而且容错的。Flume使用简单的可扩展的数据模型,能够用于在线数据分析。 官网:http://flume 阅读全文
posted @ 2016-06-23 15:18 唠叨阁大学士 阅读(293) 评论(0) 推荐(0) 编辑
摘要: Apache Flink是一个分布式流式和批量数据处理的开源平台。 Flink的核心是一个流式数据流动引擎,它为数据流上面的分布式计算提供数据分发、通讯、容错。Flink包括几个使用 Flink引擎创建应用程序的编程接口: 1. DataStream API 集成在Java和Scala中中的流数据格 阅读全文
posted @ 2016-06-23 14:30 唠叨阁大学士 阅读(1131) 评论(0) 推荐(0) 编辑