1.默认的是
2.处理小文件
1.默认分区
2.全排序:一个
3.二次排序:自定义排序范畴,实现
2.
1.默认
![](https://img2024.cnblogs.com/blog/35695/202407/35695-20240713070336838-1837943664.jpg)
TextInputFormat
,key
偏移量,value
一行内容。CombineTextInputFormat
把多个文件合并到一起统一切片。setup()
初始化;map()
用户的业务逻辑;clearup()
关闭资源HashPartitioner
,默认按照key
的hash值%numreducertask的个数
reducer
,对所有数据大排序。writableCompare
接口,重写compareTo
方法(总流量排序 按照上行流量 正序)setup()
初始化;reducer()
用户的业务逻辑;clearup()
关闭资源TextOutputFormat
按行输出到文件