摘要: 恢复内容开始 大数据的分布式计算框架目前使用的最多的就是hadoop的mapReduce和Spark,mapReducehe和Spark之间的最大区别是前者较偏向于离线处理,而后者重视实现性,下面主要介绍mapReducehe和Spark两者的shuffle过程。 MapReduce的Shuffle 阅读全文
posted @ 2020-06-08 18:13 高少侠也在江湖 阅读(1486) 评论(0) 推荐(0) 编辑