摘要: hadoop source job 类 JobSubmitter.submitJobInternal() The job submission process involves: 1. Checking the input and output specifications of the job. 阅读全文
posted @ 2016-05-24 23:25 傾聽雨落 阅读(209) 评论(0) 推荐(0) 编辑
摘要: 许多mapreduce作业会受限与集群的带宽,因此尽量降低map和reduce任务之间的数据传输是有必要的。Hadoop允许用户针对map任务的输出指定一个combiner函数处理map任务的输出,并作为reduce函数的输入。因为combine是优化方案,所以Hadoop无法确定针对map输出记录 阅读全文
posted @ 2016-05-24 19:55 傾聽雨落 阅读(665) 评论(0) 推荐(0) 编辑
摘要: 注:随笔 取自于 hadoop权威指南第四版 Hadoop 会讲MapReduce输入的数据切分成大小相等的数据块(fixed size 固定大小,我认为翻译成相等大小比较合适),或者称之为分片。Hadoop会未每一个分片创建一个map 任务,并由该任务来运行用户自定义的map函数。 一个输入数据可 阅读全文
posted @ 2016-05-24 18:42 傾聽雨落 阅读(420) 评论(0) 推荐(0) 编辑