摘要: common join 普通join,性能较差,存在Shuffle map join 适用情况:大表join小表时,做不等值join 原理:将小表数据广播到各个节点,存储在内存中,在map阶段直接join,不需要进行reduce,没有了shuffle 优点:性能大大提高 限制:小表需要在内存中放的下 阅读全文
posted @ 2021-08-31 16:40 梦里繁花 阅读(676) 评论(0) 推荐(0) 编辑