dremio 23.0 版本发布

最近dremio 23 版本发布了(社区版以及下载地址还没提供),一些变动还是比较大的

破坏性变动

  • mapr 只支持6.2.0 了,对于mapr 也只支持jdk 11
  • dremio 可以直接读取parquet 文件的map 类型,对于包含了map 类型的需要刷新元数据,同时也支持开关可以关闭此特性

已知的问题

  • 不支持使用相等删除编写的 Iceberg 表(具体待测试,应该是icerge 对应的特性)
  • dml 不支包含map 的列,CTAS 支持

新特性

  • map 类型支持
  • listagg 方便分组聚合了,具体能力还需要测试
  • job profiler 增强,可以快速查找耗时的步骤
  • 不在使用的嵌入式的nessie 历史数据,将被清理,以提升性能以及后续升级问题
  • iceberg timestap 支持查询
  • 宽表支持(以前dremio 有800列的限制,目前来说还有,就是放大了,当然还有不少限制,建议看看官方文档)
  • aws 数据源,支持私有url 格式的数据
  • icegerg 表支持基于位置删除
  • openjdk 8 以及11 废弃,推荐使用其他jdk 替代

说明

其他安全升级以及bug 修复也不少,等待新版本的发布

参考资料

https://docs.dremio.com/software/release-notes/230-release/
https://docs.dremio.com/software/sql-reference/sql-functions/functions/LISTAGG/
https://docs.dremio.com/software/sql-reference/sql-commands/apache-iceberg-tables/apache-iceberg-select/
https://docs.dremio.com/software/data-sources/wide-tables/
https://iceberg.apache.org/spec/#position-delete-files
https://iceberg.apache.org/spec/#equality-delete-files

posted on   荣锋亮  阅读(60)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
历史上的今天:
2020-10-08 nessie 安装&&简单试用
2020-10-08 nessie 类似git 管理数据湖
2020-10-08 一些不错的开源大数据虚拟数据sql 查询引擎
2020-10-08 What Is a Data Lake Engine?
2019-10-08 typedi 强大的javascript以及typescript 依赖注入框架
2019-10-08 使用overnightjs typescript 注解开发expressjs 应用
2018-10-08 jaeger 使用ElasticSearch 作为后端存储

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示