dremio vectorized Parquet Reader v2 支持

dremio 从24.3 开始支持parquet v2 writer 同时性能提升还是很明显的

对于读

官方在TPC-DS测试中,最低有22% 左右的,最高97%,平均77% 左右

写入

同样也是TPC-DS 中,存储降低24%左右,写入提升1.5% 左右,如果开启了c3 读性能提升6.4%

开启

  • ui配置(全局)

可以通过support key

  • sql 配置(全局)
 
ALTER SYSTEM SET "store.parquet.writer.version" = 'v2'

说明

目前我小数据量的测试,存储的确减少了一些,但是读可能因为数据比较少,并没有明显的变化,数据量大可能效果比较明显,同时默认的向量化读v2 已经开启了vectorized.read.parquet.v2.encodings=true

参考资料

sabot/kernel/src/main/java/com/dremio/exec/store/parquet/ParquetRecordWriter.java
sabot/kernel/src/main/java/com/dremio/exec/ExecConstants.java
https://www.dremio.com/blog/vectorized-reading-of-parquet-v2-improves-performance-up-to-75/

posted on   荣锋亮  阅读(10)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
历史上的今天:
2023-02-01 mtools mongo 日志分析的利器
2023-02-01 nginx agent 来自官方的nginx 配置管理&监控方案
2022-02-01 Building a Sync Engin
2022-02-01 grouparoo 基于nodejs 的开源反向ETL 工具
2022-02-01 Castled 源码解析 - container 模块说明
2021-02-01 cube.js 上下文实践的一些说明
2020-02-01 Performance Profiling Zeebe

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示