MapReduce之Map Join
摘要:
一 介绍 之所以存在Reduce Join,是因为在map阶段不能获取所有需要的join字段,即:同一个key对应的字段可能位于不同map中。Reduce side join是非常低效的,因为shuffle阶段要进行大量的数据传输。 Map Join是针对以下场景进行的优化:两个待连接表中,有一个表 阅读全文
posted @ 2018-12-15 23:16 PerfectData 阅读(390) 评论(0) 推荐(0) 编辑