会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
九天高远
鹤知九天高远,深谙境界之美!
博客园
首页
新随笔
联系
订阅
管理
2013年9月15日
hadoop 多表join:Map side join及Reduce side join范例
摘要: 最近在准备抽取数据的工作。有一个id集合200多M,要从另一个500GB的数据集合中抽取出所有id集合中包含的数据集。id数据集合中每一个行就是一个id的字符串(Reduce side join要在每行的行尾加“,”号,而Map side join不必,如果加了也可以处理掉),类似,500GB的数据
阅读全文
posted @ 2013-09-15 22:22 九天高远
阅读(3899)
评论(0)
推荐(0)
编辑
公告