摘要: http://www.2cto.com/kf/201301/182461.html 阅读全文
posted @ 2014-08-27 13:54 xiongjianjun 阅读(30) 评论(0) 推荐(0) 编辑
摘要: 概念:Hadoop有一个叫DataJoin的包为Data Join提供相应的框架。它的Jar包存在于contrib/datajoin/hadoop-*-datajoin。为区别于其他的data join技术,我们称其为reduce-side join。(因为我们在reducer上作大多数的工作)re... 阅读全文
posted @ 2014-08-27 13:37 xiongjianjun 阅读(219) 评论(0) 推荐(0) 编辑