dremio vectorized Parquet Reader v2 支持
dremio 从24.3 开始支持parquet v2 writer 同时性能提升还是很明显的
对于读
官方在TPC-DS测试中,最低有22% 左右的,最高97%,平均77% 左右
写入
同样也是TPC-DS 中,存储降低24%左右,写入提升1.5% 左右,如果开启了c3 读性能提升6.4%
开启
- ui配置(全局)
可以通过support key
- sql 配置(全局)
ALTER SYSTEM SET "store.parquet.writer.version" = 'v2'
说明
目前我小数据量的测试,存储的确减少了一些,但是读可能因为数据比较少,并没有明显的变化,数据量大可能效果比较明显,同时默认的向量化读v2 已经开启了vectorized.read.parquet.v2.encodings=true
参考资料
sabot/kernel/src/main/java/com/dremio/exec/store/parquet/ParquetRecordWriter.java
sabot/kernel/src/main/java/com/dremio/exec/ExecConstants.java
https://www.dremio.com/blog/vectorized-reading-of-parquet-v2-improves-performance-up-to-75/
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
2023-02-01 mtools mongo 日志分析的利器
2023-02-01 nginx agent 来自官方的nginx 配置管理&监控方案
2022-02-01 Building a Sync Engin
2022-02-01 grouparoo 基于nodejs 的开源反向ETL 工具
2022-02-01 Castled 源码解析 - container 模块说明
2021-02-01 cube.js 上下文实践的一些说明
2020-02-01 Performance Profiling Zeebe