linzch3

2018年11月19日

摘要：需求测试数据 type.txt（type表） log.txt（log表）注：数据均以TAB键划分目标输出实现方式一：Reducer端的join实现思路在Mapper阶段：将 type.txt 和 log.txt 放在同一个文件夹上，通过判断输入文件的路径来判断数据来自哪个表对于type 阅读全文

posted @ 2018-11-19 13:55 linzch3 阅读(594) 评论(0) 推荐(0)

2018年11月15日

mapreduce二次排序详解

摘要：什么是二次排序待排序的数据具有多个字段，首先对第一个字段排序，再对第一字段相同的行按照第二字段排序，第二次排序不破坏第一次排序的结果，这个过程就称为二次排序。如何在mapreduce中实现二次排序 mapreduce的工作原理 MR的工作原理如下图（如果看不清可右键新标签页查看）：图片部分数据阅读全文

posted @ 2018-11-15 10:15 linzch3 阅读(3782) 评论(0) 推荐(0)

公告