假期周进度报告5

(1)本周做了什么,花在学习上多长时间,花在代码上多长时间,花在解决问题用了多长时间

本周主要完成了对于Hadoop框架当中的Yarn的学习,每天会抽出三小时的时间进行学习。

科三考试已经通过,满分一把过!!!这礼拜继续学习科二。

YARN是Apache Hadoop生态系统的一个关键组件,它是资源管理器和作业调度器。在Hadoop 2.0版本中引入了YARN,它取代了旧版本中的MapReduce作业调度器。YARN的目标是提供更好的集群资源管理和作业调度,从而使Hadoop集群能够更高效地运行各种类型的应用程序。

YARN有两个主要组件:

  1. ResourceManager(资源管理器):ResourceManager是整个集群的主要调度器和资源分配者。它负责接收来自客户端的作业提交请求,并决定将作业提交给哪个NodeManager来执行。ResourceManager跟踪集群中所有资源的使用情况,并确保资源在不同应用程序之间进行合理的分配。

  2. NodeManager(节点管理器):每个集群节点都运行一个NodeManager,它负责管理该节点上的资源和容器。NodeManager负责与ResourceManager通信,汇报本地资源的使用情况,并接收来自ResourceManager的作业调度指令。它启动和监控容器(container),容器是YARN中资源的基本单位,它们是封装应用程序执行所需资源的实体。

YARN允许不仅限于MapReduce的各种应用程序在Hadoop集群上运行,例如Apache Spark、Apache Hive、Apache Tez等。它使Hadoop集群能够更好地支持多样化的计算模型,从而提高了资源利用率和整体性能。

在YARN中,作业提交到ResourceManager后,ResourceManager将应用程序分解为一系列任务,然后通过NodeManager在集群的不同节点上运行这些任务。资源管理器和节点管理器的协同工作,确保资源的高效利用,并提供对各种应用程序的弹性和共享资源的能力。

总的来说,YARN是Hadoop集群中的关键组件,它为各种类型的应用程序提供了强大的资源管理和调度功能,使Hadoop能够更加灵活和高效地运行。

(2)下周准备做什么

下周的目标是完成Hive的学习,这也是Hadoop框架的另一个重要组成部分。

(3)本周遇到的问题

没啥大问题,都是小case

posted @   努力学习2333  阅读(12)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
历史上的今天:
2022-08-05 [C++]将两个互为倒序的字符串转为整数并返回他们的和
点击右上角即可分享
微信分享提示