2017 年 9月 25 日随笔档案 - 任性的大萝卜

2017年9月25日

MapReduce的运行流程

摘要： input：读取数据 map：将整个任务分割成多个task，每个task处理一部分数据 shuffle：对数据进行分区、排序、分组 reduce：将所有分割的任务的处理结果进行合并 output：将整个程序的结果进行输出例如：文本中含有数据 hadoop hive hbase hadoop hiv 阅读全文

posted @ 2017-09-25 00:49 任性的大萝卜阅读(102) 评论(0) 推荐(0) 编辑

任性的大萝卜

MapReduce的运行流程

导航

公告