Hadoop(17)-MapReduce框架原理-MapReduce流程,Shuffle机制,Partition分区
摘要:
MapReduce工作流程 1.准备待处理文件 2.job提交前生成一个处理规划 3.将切片信息job.split,配置信息job.xml和我们自己写的jar包交给yarn 4.yarn根据切片规划计算出MapTask的数量 (以一个MapTask为例) 5.Maptask调用inputFormat 阅读全文
posted @ 2018-12-11 19:42 nt杨 阅读(527) 评论(0) 推荐(0) 编辑