延迟调度总结

流式计算的调度复杂性在于需要考虑公平性和数据本地化。

FIFO调度
FIFO是一个简单的调度策略,适合用于作业并发少,或者无作业并发,且作业的map任务数量大,最好是大于等于集群的slot数量。FIFO调度中经典的两个问题

head-of-line
小作业,多作业并发的场景,量化数据本地化的公式为,为总的slot,为map任务需要的slot

sticky slots
大作业,多作业并发,slot数量小于总作业所需的slot数。作业能达到的最大本地化是

延迟调度
适用于大作业、适用于小作业、适用于长作业。延迟调度是一个综合表现比较好的调度策略。注意:大量作业并发也会存在数据本地化偏低的情况。

Hadoop延迟调试

1. 多级延迟调度

2. map任务做延迟调度,reduce任务不做延迟调度

3. 本地化公式:=73%

D:每秒能释放的slot=S/T

posted @   快乐就好  阅读(470)  评论(0编辑  收藏  举报
编辑推荐:
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
阅读排行:
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架
点击右上角即可分享
微信分享提示