摘要: 1 reduce side join在map端加上标记, 在reduce容器保存,然后作笛卡尔积缺点: 有可能oom2 map side join 2.1 利用内存和分布式缓存,也有oom风险2.2 自己的想法,参考hive桶的思路, 第一次MR,将两个文件相同的方法分文件输出并打上标记,排序输出,... 阅读全文
posted @ 2014-09-20 20:36 谭志宇 阅读(501) 评论(0) 推荐(0) 编辑