摘要: 随着数据体量的日益增长,人们对 Hudi 的查询性能也提出更多要求,除了 Parquet 存储格式本来的性能优势之外,还希望 Hudi 能够提供更多的性能优化的技术途径,尤其当对 Hudi 表进行高并发的写入,产生了大量的小文件之后,又需要使用 Presto/Trino 对 Hudi 表进行高吞吐的 阅读全文
posted @ 2023-08-14 21:53 亚马逊云开发者 阅读(102) 评论(0) 推荐(0) 编辑
摘要: 概览 JuiceFS 是一款面向云原生设计的高性能共享文件系统,在 Apache 2.0 开源协议下发布。JuiceFS 提供完备的 POSIX 兼容性,可将几乎所有对象存储接入本地作为海量本地磁盘使用,亦可同时在跨平台、跨地区的不同主机上挂载读写。JuiceFS 也提供如 HDFS 兼容的 API 阅读全文
posted @ 2023-08-14 13:50 亚马逊云开发者 阅读(45) 评论(0) 推荐(0) 编辑