1.TextInputFormat类中使用父类的getSplit方法。其中拆分split时,以文件为单位进行循环。如果文件大于splitSize则进行拆分,否则一个文件为一个split。默认使用blockSize获取splitSize。进行逻辑分割成若干split

2NLineInputFormat类中自定了getsplit方法。根据设定的行数进行拆分,创建新的split。默认行数为1.

3.NLineInputformat决定每个mapper处理记录数是相同的