打赏
摘要: 需求:1.统计每一个用户(手机号)所耗费的总上行流量、下行流量,总流量 1.数据如下:保存为.dat文件(因为以\t切分数据,文件格式必须合适) 2.技术实现过程: 1.首先将Map输入中的手机号,上行流量,下行流量数据抽取出来(每一行输入数据调用一次自定义map方法处理数据), 然后根据相同的ke 阅读全文
posted @ 2018-06-20 17:28 QueryMarsBo 阅读(1101) 评论(0) 推荐(1) 编辑
摘要: 1.Wordcount示例编写: MapReduce采用”分而治之”的思想,把对大规模数据集的操作,分发给一个主节点管理下的各个分节点共同完成,然后通过整合各 个节点的中间结果,得到最终结果。简单地说,MapReduce就是”任务的分解与结果的汇总” 需求:在一堆给定的文本文件中统计输出每一个单词出 阅读全文
posted @ 2018-06-20 14:15 QueryMarsBo 阅读(394) 评论(0) 推荐(0) 编辑
摘要: 1.MapReduce原理篇 Mapreduce是一个分布式运算程序的编程框架,是用户开发“基于hadoop的数据分析应用”的核心框架; Mapreduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行 在一个hadoop集群上 2.MapReduce程序结 阅读全文
posted @ 2018-06-20 07:59 QueryMarsBo 阅读(177) 评论(0) 推荐(0) 编辑