摘要: map-side join: map-side join顾名思义就是join的动作在map阶段完成, 不必动用reducer. 但是要用上map-side join必须满足的条件是两个join的表, 必须有一个足够小. 小到可以使用 Hadoop的 DistributedCache 功能把小表缓存到 阅读全文
posted @ 2018-04-13 16:52 爱知菜 阅读(38) 评论(0) 推荐(0) 编辑