delta lake 2.0 预览版发布

就在几天前delta lake 2.0 预览版发布了,从功能上来说,官方完全开源了以前一些商业版的特性

包含的一些特性

  • cdf 支持,比较适合数据变动处理
  • z-order ,可以支持更好的查询过滤处理
  • 支持删除列
  • 支持动态分片覆盖

说明

以上只是部分,实际上delta lake 现在已经不依赖spark 也可以进行操作了,现在presto,flink,trino 都已经支持了,很值得学习使用了

参考资料

https://databricks.com/blog/2022/06/30/open-sourcing-all-of-delta-lake.html
https://delta.io/blog/2022-05-05-delta-lake-1-2-released/
https://delta.io/blog/2022-04-27-writing-to-delta-lake-from-apache-flink/
https://github.com/delta-io/delta/releases
https://docs.delta.io/2.0.0rc1/delta-change-data-feed.html
https://docs.delta.io/2.0.0rc1/optimizations-oss.html#z-ordering-multi-dimensional-clustering

posted on   荣锋亮  阅读(117)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
历史上的今天:
2021-07-03 使用parquetjs 创建parquet 文件
2021-07-03 dremio 数据格式的一些说明
2021-07-03 集成minio sidekick & console 的测试
2019-07-03 nexus 3.17.0 做为golang 的包管理工具
2018-07-03 coredns 代理consul 运行noamd 部署的应用
2014-07-03 AllJoyn 了解

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示