Flink - Flink介绍
一、Flink是什么?
Apache Flink是一个框架和分布式处理引擎(用来计算,不是用来储存的),用于对无界和有界数据流进行状态计算。
二、为什么选择Flink? Flink vs Spark Streaming?
spark streaming | Flink | |
定义 | 弹性的分布式数据集,并非真正的实时计算,实际上还是“微”批处理 | 真正的流计算 |
1.低延迟
- Spark streaming,实际上还是“微”批处理,延迟是秒级
- Flink延迟是毫秒级,每秒处理数百万个事件
2.高吞吐
3.结果的准确性+良好的容错性
三、Flink的主要特点
3.1 事件驱动 Event-driven
3.2 API分层
四、Flink vs Spark Streaming
4.1 架构不同
Flink:实时流处理
Spark Streaming: 微批处理
4.2 数据模型不同
4.3 运行时架构不同