摘要: 一篇超级详细的文章:this one 读完之后感触颇深,什么时候在map的时候join什么时候在reducer的时候join 之前写两个输入的时候,写的多么可笑,效率极低。 先用了一遍这篇文章的分布式缓存,在reduce的时候读取,因为hadoop版本太低,所以又做了修改,结合好几篇文章结果: 版本 阅读全文
posted @ 2017-04-21 22:44 Amelie.tingting 阅读(146) 评论(0) 推荐(0) 编辑