flink与spark执行的区别
flink与spark执行的区别
(1)spark可以在map端进行预聚合,flink却不可以;
flink数据直接发送到下游,并且每一条数据都会被处理
(2)spark先执行maptask,再执行reducetask;
flink是maptask和reducetask同时执行,等待数据过来
(3)spark是mapreduce模型
flink是持续流模型
flink与spark都是粗粒度资源调度(mapreduce是细粒度资源调度)
flink的keyBy将相同的key发送到同一个下游的task中;
从上游往下游发送数据,并不是一条数据发送一次
数据从上游task发送到下游task有缓冲
满足下面两个条件的一个,都会产生缓冲:
1、时间超过200ms
2、数据量达到32kb
分类:
Flink
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!
· 零经验选手,Compose 一天开发一款小游戏!