会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
风雷
风雷的博客
博客园
首页
新随笔
联系
订阅
管理
2014年9月20日
总结的MR中连接操作
摘要: 1 reduce side join在map端加上标记, 在reduce容器保存,然后作笛卡尔积缺点: 有可能oom2 map side join 2.1 利用内存和分布式缓存,也有oom风险2.2 自己的想法,参考hive桶的思路, 第一次MR,将两个文件相同的方法分文件输出并打上标记,排序输出,...
阅读全文
posted @ 2014-09-20 20:36 谭志宇
阅读(501)
评论(0)
推荐(0)
编辑
公告