|NO.Z.00006|——————————|BigDataEnd|——|Hadoop&Hadoop核心框架.V06|——|Hadoop.v06|HDFS/MapReduce/YARN框架|
一、[Hadoop重要组成之HAFS/MapReduce/YARN框架]
### --- Hadoop重要组成之HAFS框架
~~~ 1、Hadoop=HDFS(分布式文件系统)+MapReduce(分布式计算框架)+Yarn(资源协调框架)+Common模块
~~~ 2、Hadoop HDFS:(Hadoop Distribute File System )一个高可靠、高吞吐量的分布式文件系统
~~~ 比如:100T数据存储,
~~~ “分而治之”
~~~ 分:拆分--》数据切割,100T数据拆分为10G一个数据块由一个电脑节点存储这个数据块。
~~~ 3、数据切割、制作副本、分散储存

### --- 图中涉及到几个角色
~~~ NameNode(nn):存储文件的元数据,比如文件名、文件目录结构、文件属性(生成时间、副本数、文件权限),以及每个文件的块列表和块所在的DataNode等。
~~~ SecondaryNameNode(2nn):辅助NameNode更好的工作,用来监控HDFS状态的辅助后台程序,每隔一段时间获取HDFS元数据快照。
~~~ DataNode(dn):在本地文件系统存储文件块数据,以及块数据的校验
~~~ 注意:NN,2NN,DN这些既是角色名称,进程名称,代指电脑节点名称!!
二、Hadoop MapReduce架构介绍:一个分布式的离线并行计算框架
### --- Hadoop MapReduce架构介绍:一个分布式的离线并行计算框架
~~~ 1、拆解任务、分散处理、汇整结果
~~~ 2、MapReduce计算 = Map阶段 + Reduce阶段
~~~ 3、Map阶段就是“分”的阶段,并行处理输入数据;
~~~ 4、Reduce阶段就是“合”的阶段,对Map阶段结果进行汇总;

三、Hadoop YARN:作业调度与集群资源管理的框架:计算资源协调

### --- Yarn中有如下几个主要角色,同样,既是角色名、也是进程名,也指代所在计算机节点名称。
~~~ ResourceManager(rm):处理客户端请求、启动/监控ApplicationMaster、监控NodeManager、资源分配与调度;
~~~ NodeManager(nm):单个节点上的资源管理、处理来自ResourceManager的命令、处理来自ApplicationMaster的命令;
~~~ ApplicationMaster(am):数据切分、为应用程序申请资源,并分配给内部任务、任务监控与容错。
~~~ Container:对任务运行环境的抽象,封装了CPU、内存等多维资源以及环境变量、启动命令等任务运行相关的信息。
~~~ ResourceManager是老大,NodeManager是小弟,ApplicationMaster是计算任务专员。
~~~ Hadoop Common:支持其他模块的工具模块(Configuration、RPC、序列化机制、日志操作)

Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart
——W.S.Landor
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通