hadoop中的方法的作用

/*
 * InputFormat类;
 * 
 * 作用:
 * 1.设置输入的形式;
 * 2.将输入的数据按照相应的形式分割成一个个spilts后再进一步拆分成<key,value>对作为Mapper的输入;
 * 3.默认使用TextInputFormat类进行处理;
 * 4.可以通过job.setInputFormatClass()方法进行设置;
 * 
 * */

 


/*
 * Mapper类 
 * 
 * 作用:
 * 1.接受MapReduce框架处理后的<key,value>对;
 * 2.并且通过实现map()方法,转化为中间结果的<key,value>对;
 * 3.可以通过job.setMapperClass()进行设置;
 * 
 **/

 


 

/*******Combiner类*****/
/*
 * 作用:
 * 1.实现combine()方法,合并中间结果中具有相同key值的键值对;
 * 2.可以通过job.setCombinerClass()进行设置;
 * 
 * */

 


 

/*
 * Partitioner类
 * 
 * 作用:
 * 1.用于在Shuffle过程中按照key值将中间数据分解成R份,每一份由一个Reducer负责处理;
 * 2.默认采用哈希函数完成Shuffle过程;
 * 3.可以通过job.setPartitionerClass()设置;
 * 
 */


/*
 * Reducer类
 * 
 * 作用:
 * 1.实现reduce()方法
 * 2.将中间结果合并,得到最终结果;
 * 3.可以通过job.setReducerClass()设置; 
 */


/*
 * OutputFormat类
 * 
 * 作用:设置Reducer过程输出最终结果键值对的类型;
 */


/********OutputFormatClass类****************/
/*
 * 作用:设置输出的结果的形式;
 * 
 * */


 

 

分享至:http://bbs.csdn.net/topics/390536510

posted @   Answer.AI.L  阅读(195)  评论(0编辑  收藏  举报
编辑推荐:
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
阅读排行:
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· DeepSeek如何颠覆传统软件测试?测试工程师会被淘汰吗?
点击右上角即可分享
微信分享提示