摘要: 简单概括:Map/Reduce是分布式离线处理的一个框架。 Yarn是Map/Reduce中的一个资源管理器。 一.图形说明下Map/Reduce结构: 官方示意图: 另外还可以参考这个: 流程介绍: HDFS首先会把块进行逻辑上切片处理,然后进行Map映射。一个切片对应一个Map映射。 因为文件内 阅读全文
posted @ 2019-09-24 07:42 数据驱动 阅读(648) 评论(0) 推荐(0) 编辑