03-Flink特点,与Spark Streaming对比
官网定义一句话
Apache Flink is a framework and distributed processing engine for stateful computations over unbounded and bounded data streams
Apache Flink是一个框架,是一个可以在有界和无界数据流上进行有状态计算的分布式处理引擎
特点
低延迟,高吞吐,高容错,
流批一体
基于事件处理,无序时间处理
有状态计算,
Exactly-once容错保证(checkpoint,savepoint)
对比
Flink: 流处理 基于Event 不需要stage转换
Spark Streaming: 微批处理 基于RDD stage转换