hadoop入门(11):hdfs的java编程-小文件合并
上一篇章涉及到了I/O方式上传下载文件
这一篇我们来实现一下小文件合并
代码
/**
* 小文件合并:读取本地小文件合并到hdfs的大文件中
*/
@Test
public void mergeFile() throws URISyntaxException, IOException, InterruptedException {
// 获取分布式文件系统
FileSystem fileSystem = FileSystem.get(new URI("hdfs://node001:8020"), new Configuration(), "sjj");
FSDataOutputStream fsDataOutputStream = fileSystem.create(new Path("/xxx/.../bigFile.xml"));
// 获取本地文件系统
LocalFileSystem localFileSystem = FileSystem.getLocal(new Configuration());
// 读取本地文件
FileStatus[] fileStatuses = localFileSystem.listStatus(new Path("/xxx/.../smallFiles"));
for(FileStatus fileStatus:fileStatuses){
// 获取每一个本地文件路径
Path path = fileStatus.getPath();
// 读取本地小文件
FSDataInputStream fsDataInputStream = localFileSystem.open(path);
// 流对拷 org.apache.commons.io.IOUtils
IOUtils.copy(fsDataInputStream,fsDataOutputStream);
// 释放资源
IOUtils.closeQuietly(fsDataInputStream);
}
// 释放资源
IOUtils.closeQuietly(fsDataOutputStream);
localFileSystem.close();
fileSystem.close();
}
分类:
Hadoop
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!