hadoop学习(6)

本周学习Combiner总结:

MapReduce编程模型中,在Mapper和Reducer之间有一个非常重要的组件,它解决了上述的性能瓶颈问题,它就是Combiner

   本周我花了15小时学习Hadoop中的Combiner的使用。

   在学习阶段,我用了8小时来阅读相关文档和教程,了解Combiner的概念、作用以及在MapReduce作业中的应用场景。

   我还花了5小时编写和测试使用CombinerMapReduce代码,以优化作业性能。

   在解决问题方面,我花了2小时来处理在学习和编码过程中遇到的一些问题,主要涉及Combiner的正确配置和调试。

2)下周计划:

   下周我计划深入学习MapReduce中的排序和分组初步探索Hadoop默认的排序算法,并通过自定义排序,对排序深入学习。探索Hadoop中的默认分组规则

3)本周遇到的问题:

   在学习Combiner时,我遇到了一些有关Combiner的配置和参数设置的问题,需要仔细查看文档和示例代码以解决。

   在编写使用CombinerMapReduce作业时,我遇到了一些关于数据格式和键值对处理的问题,需要进行代码调试和优化。

   另外,我还需要解决如何在不同数据集和场景中有效地使用Combiner的问题,以提高作业性能。

 

posted @ 2023-08-19 09:05  旺旺大菠萝  阅读(39)  评论(0编辑  收藏  举报