2016 年 11月 23 日随笔档案 - 松伯

2016年11月23日

摘要：我们都知道Spark的每个task运行在不同的服务器节点上，map输出的结果直接存储到map任务所在服务器的存储体系中，reduce任务有可能不在同一台机器上运行，所以需要远程将多个map任务的中间结果fetch过来。那么我们就来学习下shuffleClient。shuffleClient存在于每个阅读全文

posted @ 2016-11-23 22:18 松伯阅读(1985) 评论(0) 推荐(0) 编辑