摘要: 此例子摘自hadoop基础教程。 其中sales.txt内容如下 accounts.txt内容如下: 我们的目标是通过reduce端联结求出每个客户姓名 消费的次数 消费额 代码如下: 结果截图 阅读全文
posted @ 2017-08-31 23:28 xing-xing 阅读(143) 评论(0) 推荐(0) 编辑
摘要: 本节我们使用C++和python实现wordcount的编写 首先我们介绍一下hadoop streaming。 mapper和reducer会从标准输入中读取用户数据,一行一行处理后发送给标准输出。Streaming工具会创建MapReduce作业,发送给各个tasktracker,同时监控整个作 阅读全文
posted @ 2017-08-31 16:53 xing-xing 阅读(169) 评论(0) 推荐(0) 编辑