Daft nessie rest catalog + dremio 集成

Daft 内部使用了pyiceberg 进行iceberg 的表操作,对于具体的catalog 都是pyiceberg 内部的能力,实际上我们可以直接集成nessie, 目前pyiceberg 对于rest catalog 支持的比较好,同时nessie 也支持rest catalog 了,以下是一个集成简单说明

参考集成图

如下图

简单说明

上图中,我们部署nessie,同时配置s3以及pg,对于Daft 以及dremio 使用nessie 的rest catalog,对于Daft 来说基于rest catalog,我们可以进行数据的读写处理,对于dremio 当前的catalog 只支持数据的读取(dremio 的配置需要指定s3 的key 信息,进行数据的读处理)

说明

以上是一个集成上的简单说明,后边说明下具体的代码以及配置

参考资料

https://py.iceberg.apache.org/configuration/#fileio

https://github.com/projectnessie/nessie/releases/tag/nessie-0.90.2

https://github.com/apache/iceberg-python/issues/540

posted on   荣锋亮  阅读(5)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
历史上的今天:
2024-02-10 dbt-jsonschema 来自dbt 官方的schema check 工具
2024-02-10 dremio 的InformationSchemaCatalog 服务三
2022-02-10 lakefs sdk 使用
2022-02-10 lakefs 组件
2022-02-10 dremio 20.1 官方release note 提供了
2022-02-10 使用minio 做为lakefs 的数据存储
2022-02-10 lakefs 源码构建

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示