假期周进度报告5
(1)本周做了什么,花在学习上多长时间,花在代码上多长时间,花在解决问题用了多长时间
本周主要完成了对于Hadoop框架当中的Yarn的学习,每天会抽出三小时的时间进行学习。
科三考试已经通过,满分一把过!!!这礼拜继续学习科二。
YARN是Apache Hadoop生态系统的一个关键组件,它是资源管理器和作业调度器。在Hadoop 2.0版本中引入了YARN,它取代了旧版本中的MapReduce作业调度器。YARN的目标是提供更好的集群资源管理和作业调度,从而使Hadoop集群能够更高效地运行各种类型的应用程序。
YARN有两个主要组件:
-
ResourceManager(资源管理器):ResourceManager是整个集群的主要调度器和资源分配者。它负责接收来自客户端的作业提交请求,并决定将作业提交给哪个NodeManager来执行。ResourceManager跟踪集群中所有资源的使用情况,并确保资源在不同应用程序之间进行合理的分配。
-
NodeManager(节点管理器):每个集群节点都运行一个NodeManager,它负责管理该节点上的资源和容器。NodeManager负责与ResourceManager通信,汇报本地资源的使用情况,并接收来自ResourceManager的作业调度指令。它启动和监控容器(container),容器是YARN中资源的基本单位,它们是封装应用程序执行所需资源的实体。
YARN允许不仅限于MapReduce的各种应用程序在Hadoop集群上运行,例如Apache Spark、Apache Hive、Apache Tez等。它使Hadoop集群能够更好地支持多样化的计算模型,从而提高了资源利用率和整体性能。
在YARN中,作业提交到ResourceManager后,ResourceManager将应用程序分解为一系列任务,然后通过NodeManager在集群的不同节点上运行这些任务。资源管理器和节点管理器的协同工作,确保资源的高效利用,并提供对各种应用程序的弹性和共享资源的能力。
总的来说,YARN是Hadoop集群中的关键组件,它为各种类型的应用程序提供了强大的资源管理和调度功能,使Hadoop能够更加灵活和高效地运行。
(2)下周准备做什么
下周的目标是完成Hive的学习,这也是Hadoop框架的另一个重要组成部分。
(3)本周遇到的问题
没啥大问题,都是小case
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
2022-08-05 [C++]将两个互为倒序的字符串转为整数并返回他们的和