基于dremio 开发一个简单的反向ETL

反向ETL 目前是一个和不错的领域,以下是自己基于一些工具集成参考构思的一个反向ETL 设计方案,具体编码还在规划中
以下简单介绍下一些思路

参考图

 

 

 

 

简单说明

核心是利用了dremio 数据反射以及CTAS 能力(也支持drop),对于数据使用了快照的处理,直接存储在s3中,格式使用了基于时间分区的格式,同时会存储数据的元数据(大小,路径,行数),对于快照数据处理以及后续数据分发我们是基于一个任务调度框架处理的,分发上我们支持基于event 、batch、pipeline 以及传统ETL,可以到db,文件系统,外部api。。。以上是一个参考整体设计的思路,细节上后边会有介绍的,数据diff 部分我们基于了dremio 的excep sql 函数,设计上以及性能测试上还是可以的,后续会有压测说明以及详细代码说明

说明

反向ETL 是一个好东西,我们基于开源框架可以实现类似的能力,后续我会将设计的东西开源出来,同时细化设计细节

参考资料

https://github.com/dremio/dremio-oss
https://github.com/castledio/castled
https://castled.io/

posted on   荣锋亮  阅读(198)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
历史上的今天:
2019-01-20 mino 路径格式的bucket 数据访问
2019-01-20 minio 对于压缩的处理
2019-01-20 mino federation 功能
2017-01-20 Cucumber
2014-01-20 microsoft webMatrix 使用 IISnode 进行node express 开发
2014-01-20 模板引擎jade学习
2014-01-20 模板引擎之jade 学习

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示