MapReduce学习总结之架构

一、MapReduce1.x架构

jobTracker.jpg

1)jobTracker:JT

    作业的管理者

    将作业分解成一堆任务:Task(MapTask和ReduceTask)

    将任务分派给TaskTracker(TT)运行

    作业监控、容错处理(task作业挂了,重启task的机制)

    在一定的时间间隔内,JT没有收到TT的心跳信息,TT可能是挂了,TT上运行的任务会被指派到其他TT上去执行。

2)TaskTracker:TT

    任务的执行者

    在TT上执行Task(MapTask和ReduceTask)

    会与JT交互:执行/启动/停止作业,发送心跳信息给JT

3)MapTask

    自己开发的map任务交由task处理

    解析每条记录数据,交给自己的map方法处理

    将map的输出结果写到本地磁盘(有些作业仅有map,没有reduce,结果直接写到HDFS等数据存放库)

4)ReduceTask

    将MapTask输出的数据进行读取

    按照数据进行分组传给我们自己写的reduce方法处理

    输出结果到HDFS等数据存放库

 

二、MapReduce2.x架构

031438244301264.png

posted @   技术小白丁  阅读(197)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
点击右上角即可分享
微信分享提示