dlt开源数据加载工具

dlt是一个开源数据加载工具,基于python 开发

特点

  • 一个库 
    dlt 就是一个python包,其他地方需要我们自己开发
  • 非黑盒系统 
    我们可以基于代码灵活的进行自定义开发
  • 基于乘法的玩法,而不是加法
  • 自动代码生成 
    包含了类似dbt 的一些处理cli
  • 基于python 的玩法 
    dlt 对于数据的处理是基于python 开发的,同时使用上也比较符合python的玩法

官方的一个参考实践

如下图,核心是基于dlt 进行数据加载,基于dbt进行数据建模

说明

基于singer 的etl的开源方案也比较多,dlt 基于python 代码的处理也是值得尝试下的,同时dlt 与dbt 的集成也很强大,值得试用下

参考资料

https://dlthub.com/
https://github.com/dlt-hub/dlt
https://www.getdbt.com/product/what-is-dbt
https://github.com/dbt-labs/dbt-core
https://www.singer.io/
https://github.com/singer-io
https://github.com/singer-io/getting-started/blob/master/docs/SPEC.md#singer-specification

posted on 2024-02-16 08:00  荣锋亮  阅读(82)  评论(0编辑  收藏  举报

导航