dlt开源数据加载工具
dlt是一个开源数据加载工具,基于python 开发
特点
- 一个库
dlt 就是一个python包,其他地方需要我们自己开发 - 非黑盒系统
我们可以基于代码灵活的进行自定义开发 - 基于乘法的玩法,而不是加法
- 自动代码生成
包含了类似dbt 的一些处理cli - 基于python 的玩法
dlt 对于数据的处理是基于python 开发的,同时使用上也比较符合python的玩法
官方的一个参考实践
如下图,核心是基于dlt 进行数据加载,基于dbt进行数据建模
说明
基于singer 的etl的开源方案也比较多,dlt 基于python 代码的处理也是值得尝试下的,同时dlt 与dbt 的集成也很强大,值得试用下
参考资料
https://dlthub.com/
https://github.com/dlt-hub/dlt
https://www.getdbt.com/product/what-is-dbt
https://github.com/dbt-labs/dbt-core
https://www.singer.io/
https://github.com/singer-io
https://github.com/singer-io/getting-started/blob/master/docs/SPEC.md#singer-specification
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
2023-02-16 juicefs 1.0.3 集成 oceanbase 4.0 测试
2022-02-16 pf4j 官方几个比较有用的扩展
2022-02-16 pf4j 类加载顺序简单说明
2022-02-16 pf4j 插件加载机制
2022-02-16 pf4j 默认系统扩展以及机制说明
2022-02-16 pf4j 默认插件打包模式
2021-02-16 dremio prometheus监控