博客园  :: 首页  :: 联系 :: 管理

2017年10月14日

摘要: 流式(streaming)和批量( batch):流式数据,实际上更准确的说法应该是unbounded data(processing),也就是无边界的连续的数据的处理;对应的批量计算,更准确的说法是bounded data(processing),亦即有明确边界的数据的处理。 近年来流式计算框架编 阅读全文

posted @ 2017-10-14 18:40 天戈朱 阅读(3632) 评论(0) 推荐(0) 编辑

摘要: Kafka Stream是Apache Kafka从0.10版本引入的一个新Feature(当前:1.0.0-rc0,参见:https://github.com/apache/kafka/releases),它提供了对存储于Kafka内的数据进行流式处理和分析的功能。其主要特点如下: Kafka S 阅读全文

posted @ 2017-10-14 18:40 天戈朱 阅读(2030) 评论(0) 推荐(2) 编辑

摘要: KSQL是基于Kafka的Streams API进行构建的流式SQL引擎,KSQL降低了进入流处理的门槛,提供了一个简单的、完全交互式的SQL接口,用于处理Kafka的数据。 KSQL是一套基于Apache 2.0许可开源的、分布式的、可扩展的、可靠的和实时的组件。支持多种流式操作,包括聚合(agg 阅读全文

posted @ 2017-10-14 18:40 天戈朱 阅读(635) 评论(0) 推荐(0) 编辑