hadoop学习(6)

本周学习Combiner总结：

在MapReduce编程模型中，在Mapper和Reducer之间有一个非常重要的组件，它解决了上述的性能瓶颈问题，它就是Combiner

本周我花了15小时学习Hadoop中的Combiner的使用。

在学习阶段，我用了8小时来阅读相关文档和教程，了解Combiner的概念、作用以及在MapReduce作业中的应用场景。

我还花了5小时编写和测试使用Combiner的MapReduce代码，以优化作业性能。

在解决问题方面，我花了2小时来处理在学习和编码过程中遇到的一些问题，主要涉及Combiner的正确配置和调试。

（2）下周计划：

下周我计划深入学习MapReduce中的排序和分组，初步探索在Hadoop默认的排序算法，并通过自定义排序，对排序深入学习。探索Hadoop中的默认分组规则

（3）本周遇到的问题：

在学习Combiner时，我遇到了一些有关Combiner的配置和参数设置的问题，需要仔细查看文档和示例代码以解决。

在编写使用Combiner的MapReduce作业时，我遇到了一些关于数据格式和键值对处理的问题，需要进行代码调试和优化。

另外，我还需要解决如何在不同数据集和场景中有效地使用Combiner的问题，以提高作业性能。

posted @ 2023-08-19 09:05 旺旺大菠萝阅读(39) 评论(0) 编辑收藏举报

刷新页面返回顶部

fan-wang