S++

千线一眼

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

hadoop入门(11):hdfs的java编程-小文件合并

上一篇章涉及到了I/O方式上传下载文件
这一篇我们来实现一下小文件合并

代码

    /**
     * 小文件合并:读取本地小文件合并到hdfs的大文件中
     */
    @Test
    public void mergeFile() throws URISyntaxException, IOException, InterruptedException {
        // 获取分布式文件系统
        FileSystem fileSystem = FileSystem.get(new URI("hdfs://node001:8020"), new Configuration(), "sjj");
        FSDataOutputStream fsDataOutputStream = fileSystem.create(new Path("/xxx/.../bigFile.xml"));
        // 获取本地文件系统
        LocalFileSystem localFileSystem = FileSystem.getLocal(new Configuration());
        // 读取本地文件
        FileStatus[] fileStatuses = localFileSystem.listStatus(new Path("/xxx/.../smallFiles"));

        for(FileStatus fileStatus:fileStatuses){
            // 获取每一个本地文件路径
            Path path = fileStatus.getPath();
            // 读取本地小文件
            FSDataInputStream fsDataInputStream = localFileSystem.open(path);

            // 流对拷 org.apache.commons.io.IOUtils
            IOUtils.copy(fsDataInputStream,fsDataOutputStream);
            // 释放资源
            IOUtils.closeQuietly(fsDataInputStream);
        }
        // 释放资源
        IOUtils.closeQuietly(fsDataOutputStream);
        localFileSystem.close();
        fileSystem.close();
    }

posted on   S++  阅读(486)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
点击右上角即可分享
微信分享提示