摘要:
此例子摘自hadoop基础教程。 其中sales.txt内容如下 accounts.txt内容如下: 我们的目标是通过reduce端联结求出每个客户姓名 消费的次数 消费额 代码如下: 结果截图 阅读全文
摘要:
本节我们使用C++和python实现wordcount的编写 首先我们介绍一下hadoop streaming。 mapper和reducer会从标准输入中读取用户数据,一行一行处理后发送给标准输出。Streaming工具会创建MapReduce作业,发送给各个tasktracker,同时监控整个作 阅读全文