摘要: 程序的入口在:HadoopStreaming。 里面的main函数大概做了两件事:如下: StreamJob job = new StreamJob(); returnStatus = ToolRunner.run(job, args);然后调用StreamJob的run(String[] args)方法StreamJob的run方法主要负责1解析用户的输入参数1.1 将用户指定的2将输入参数转化成 JobConf, 其中主要的是解析 mapper, reducer, 并且设置: jobConf_.setMapperClass(PipeMapper.class); jobConf... 阅读全文
posted @ 2011-10-25 20:43 nosaferyao 阅读(250) 评论(0) 推荐(0) 编辑