阿里云服务器代金券领取(最高2000元)
https://www.aliyun.com/minisite/goods?userCode=3ls0qk0b
摘要: YARN分布式资源管理系统 组成: ResourceManager:YARN的资源管理器,主节点,通过NodeManager管理集群中所有的资源 NodeManager:YARN的节点管理器,从节点,通过container管理资源,一个dataNode对应一个NodeManager Containe 阅读全文
posted @ 2019-12-26 21:05 H有何不可? 阅读(509) 评论(0) 推荐(0) 编辑
摘要: MapReduce的工作流程 1.客户端将每个block块切片(逻辑切分),每个切片都对应一个map任务,默认一个block块对应一个切片和一个map任务,split包含的信息:分片的元数据信息,包含起始位置,长度,和所在节点列表等 2.map按行读取切片数据,组成键值对,key为当前行在源文件中的 阅读全文
posted @ 2019-12-26 20:46 H有何不可? 阅读(2898) 评论(0) 推荐(0) 编辑
摘要: hadoop存在的两个问题: 1.内存受限的问题 联邦解决内存受限问题。 建立多个NameNode,每个NameNode记录元数据的一部分,但是对于元数据整体来说本质上还是只有一份。 2.单点故障 HA(high available)高可用,解决hdfs的单点故障问题。 主备namenode,存储相 阅读全文
posted @ 2019-12-26 20:19 H有何不可? 阅读(155) 评论(0) 推荐(0) 编辑
阿里云服务器代金券领取(最高2000元)
https://www.aliyun.com/minisite/goods?userCode=3ls0qk0b