摘要: 以前总是用java写一些MapReduce程序现举一个例子使用Python通过Hadoop Streaming来实现Mapreduce。 任务描述: HDFS上有两个目录/a和/b,里面数据均有3列,第一列都是id,第二列是各自的业务类型(这里假设/a对应a,/b对应b),第三列是一个jso... 阅读全文
posted @ 2014-11-23 12:45 玖疯 阅读(2636) 评论(0) 推荐(0) 编辑