03 2022 档案
摘要:在使用FileSplit类内引用的jar包出现类错误,应该将这个jar包换为下面的: import org.apache.hadoop.mapreduce.lib.input.FileSplit;
阅读全文
摘要:InputFormat 切片规则(getSplits) 把切片分解成KV(createRecordReader) FileInputFormat 按文件->块大小 没有实现 TextInputFormat 继承FileInputFormat LineRecordReader<偏移量,行数据> Com
阅读全文
摘要:TextInputFormat和KeyValueInputFormat的区别是什么? TextInputformat和KeyValueTextInputFormat都继承FileInputFormat类, 每一行作为一个记录; 区别: TextInputformat将每一行在文件中的起始偏移量作为
阅读全文
摘要:Hadoop运行错误 - Output directory hdfs://master:9000/output already exists 在集群上测试: hadoop jar /opt/software/wc.jar com.atguigu.mapreduce.WordCountDriver /
阅读全文