摘要: MapReduce知识整理 MapReduce简介 MapReduce是一个用于处理海量数据的分布式计算框架,解决了(数据分布式存储,作业调度,容错,机器间通信等复杂问题) MapReduce计算框架和执行流程 运行过程文字描述 1. Map任务处理 1.1 读取HDFS上的文件,每一行通过Inpu 阅读全文
posted @ 2018-07-04 11:37 雪山过客 阅读(371) 评论(0) 推荐(0) 编辑