摘要: MapTask工作机制 并行度决定机制 1)问题引出 maptask的并行度决定map阶段的任务处理并发度,进而影响到整个job的处理速度。那么,mapTask并行任务是否越多越好呢? 2)MapTask并行度决定机制 一个job的map阶段MapTask并行度(个数),由客户端提交job时的切片个 阅读全文
posted @ 2021-08-11 12:12 张涨涨 阅读(461) 评论(0) 推荐(0) 编辑
摘要: Shuffle机制 Mapreduce确保每个reducer的输入都是按键排序的。系统执行排序的过程(Map方法之后,Reduce方法之前的数据处理过程)称之为Shuffle。 partition分区 Partition分区流程处于Mapper数据属于初到环形缓冲区时进行,此时会将通过Partiti 阅读全文
posted @ 2021-08-11 10:10 张涨涨 阅读(144) 评论(0) 推荐(0) 编辑
Live2D