摘要:
CombineFileInputFormat是一个抽象类。Hadoop提供了两个实现类CombineTextInputFormat和CombineSequenceFileInputFormat。此案例让我明白了三点:详见 解读:MR多路径输入 和 解读:CombineFileInputFormat类... 阅读全文
摘要:
回收站机制 1). HDFS 的回收站机制由 core-site.xml 中 fs.trash.interval 属性(以分钟为单位)设置,默认是 0,表示未启用。注意:配置数值应该为1440,而配置24*60会抛出NumberFormatException异常(亲测)。 2). 回收站特性被启用时... 阅读全文
摘要:
本案例采用 MultipleInputs类 实现多路径输入的倒排索引。解读:MR多路径输入package test0820;import java.io.IOException;import java.lang.reflect.Method;import org.apache.hadoop.conf... 阅读全文