随笔 - 371  文章 - 0  评论 - 12  阅读 - 243万
03 2012 档案
关于Hadoop中的采样器
摘要:1.为什么要使用采样器在这个网页上有一段描述比较靠谱 http://www.philippeadjiman.com/blog/2009/12/20/hadoop-tutorial-series-issue-2-getting-started-with-customized-partitioning/简单的来说就是解决"How to automatically find “good” partitioning function",因为很多时候无法直接制订固定的partitioner策略,所以需要知道实际的数据分布.糟糕的策略导致的结果就是每个reduce节点得到的数据部均匀, 阅读全文
posted @ 2012-03-04 12:11 阿笨猫 编辑


点击右上角即可分享
微信分享提示