flink详细介绍

Flink是什么

Flink是一个分布式计算引擎 MapReduce Spark Storm
- 同时支持流计算和批处理
- 和Spark不同, Flink是使用流的思想做批, Spark是采用做批的思想做流
Flink的优势
- 和Hadoop相比, Flink使用内存进行计算, 速度明显更优
- 和同样使用内存的Spark相比, Flink对于流的计算是实时的, 延迟更低
- 和同样使用实时流的Storm相比, Flink明显具有更优秀的API, 以及更多的支持, 并且支持批量计算
速度
- 在单机上, Storm大概能达到30万条/秒的吞吐量, 这个数据大概是Storm得3-5倍.在阿里中,Flink集群能达到每秒能处理17亿数据量,一天可处理上万亿条数据
- 一天的数据量有多大?(数据的条数/数据占用的磁盘空间)
- 10亿条数据,一条数据1KB 20亿Kb 20 00GMB 6/亿, 400G
- 在单机上, Flink消息处理的延迟大概在200毫秒左右, 这个数据大概是Spark的3-5倍

14年Apache立为顶级项目.阿里15年开始使用

Flink的母公司被阿里全资收购, 阿里一直致力于Flink在国内的推广使用

Flink的适用场景

项目外包,人员外包

对比Flink、Spark、Storm

Flink、Spark Streaming、Storm都可以进行实时计算，但各有特点

posted @ 2019-06-16 17:45 zhangqi0828 阅读(535) 评论(0) 编辑收藏举报

刷新页面返回顶部