hadoop的partitioner是用来控制map的输出到reducer的。
可以添加自定义的partioner函数来控制map的输出,来控制将制定的结果输出到特定的reducer文件中。
以便于结果的定位。
一般是根据map输出的key进行做控制,返回一个int值,来指定将map的输出到哪个reducer中。
refer http://www.cnblogs.com/xwdreamer/archive/2011/10/27/2296943.html
hadoop的partitioner是用来控制map的输出到reducer的。
可以添加自定义的partioner函数来控制map的输出,来控制将制定的结果输出到特定的reducer文件中。
以便于结果的定位。
一般是根据map输出的key进行做控制,返回一个int值,来指定将map的输出到哪个reducer中。
refer http://www.cnblogs.com/xwdreamer/archive/2011/10/27/2296943.html