2016年11月23日
摘要: 我们都知道Spark的每个task运行在不同的服务器节点上,map输出的结果直接存储到map任务所在服务器的存储体系中,reduce任务有可能不在同一台机器上运行,所以需要远程将多个map任务的中间结果fetch过来。那么我们就来学习下shuffleClient。shuffleClient存在于每个 阅读全文
posted @ 2016-11-23 22:18 松伯 阅读(1981) 评论(0) 推荐(0) 编辑