hadoop的partitioner是用来控制map的输出到reducer的。

可以添加自定义的partioner函数来控制map的输出,来控制将制定的结果输出到特定的reducer文件中。

以便于结果的定位。

一般是根据map输出的key进行做控制,返回一个int值,来指定将map的输出到哪个reducer中。

refer http://www.cnblogs.com/xwdreamer/archive/2011/10/27/2296943.html

posted on 2013-02-27 10:49  @且听风吟@  阅读(134)  评论(0编辑  收藏  举报