摘要: Shuffle原理 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.Shuffle原理 (1)map方法在将数据(K,V,P)写入到环形缓冲区之前就已经获取到分区编号了,只不过此时数据没有落地(溢写到磁盘); (2)当环形缓冲区数据快满时会发生数据溢写到磁盘,在溢写到磁盘之前会 阅读全文
posted @ 2020-03-20 23:06 JasonYin2020 阅读(840) 评论(0) 推荐(0) 编辑
摘要: GroupingComparator分组(辅助排序/组内排序) 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 如果我们不希望按照默认的key的比较进行分组时,此时就得启用GroupingComparator分组。 一.GroupingComparator分组概述 对Reduce阶 阅读全文
posted @ 2020-03-20 21:57 JasonYin2020 阅读(512) 评论(1) 推荐(0) 编辑
摘要: 合并(Combiner) 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.Combiner概述 Combiner是Mapper和Reducer之外的一种可选组件; Combiner组件的父类就是Reducer; Combiner和Reducer的区别在于运行的位置,Combin 阅读全文
posted @ 2020-03-20 00:28 JasonYin2020 阅读(516) 评论(0) 推荐(0) 编辑