07 2017 档案
摘要:有时候你会遇到这样的问题:你有一个表格,给出了每个人在十二月,一月和二月的收入。 表格如下: 姓名 一月 二月 三月 楚乔 200 314 3500 宇文玥 2000 332 2300 烟熏柿子 6000 333 680 淳儿 5000 333 789 洛河 30 12 2900 现在需要知道每个人
阅读全文
摘要:hadoop中使用MapReduce单表关联案例: MapReduce:给出children-parents(孩子——父母)表,要求输出grandchild-grandparent(孙子——爷奶)表。 给出表: 要求实现如下效果: 设计思路:将这张单表分成两张表如下: 将左表的parents列和右表
阅读全文
摘要:配置hadoop-eclipse-plugin(版本hadoop2.7.3): 1:首先下载我们需要的 hadoop-eclipse-plugin-2.7.3.jar,winutils.exe 和 hadoop.dll 链接地址:https://pan.baidu.com/s/1nuCoe0L#li
阅读全文
摘要:写出MapReduce程序完成以下功能. input1: input2: 目标操作实现结果: 代码如下(由于水平有限,不保证完全正确,如果发现错误欢迎指正): 小结:把value-list作为map的value输出,这样就不会排序和去重,然后reduce再去接收并且context.write()出来
阅读全文
摘要:已知两张数据表,其中表一存储的是学生编号、学生姓名;表二存储的是学生编号、考试科目、考试成绩;编写mapreduce程序,汇总两张表数据为一张统一表格。 表一: 表二: 正确结果: 执行java程序,打印出part-r-00000中数据: 代码如下(由于水平有限,不保证完全正确,如果发现错误欢迎指正
阅读全文