dbt dbt-codegen 包简单说明

dbt-codegen 是一个比较方便的dbt 工具包,可以用来生成模型

目前包含的macro

  • generate_source source 类的

生成source 信息,实际上就是生成source 的yaml 文件
参考运行命令
cli 模式,就是通过run-operation 执行macro

dbt --quiet run-operation generate_source --args '{"table_names": ["orders"]}' > models/staging/jaffle_shop/_sources.yml

通过macro 引用模式

{{ codegen.generate_source(schema_name= 'jaffle_shop', database_name= 'raw') }}
  • generate_base_model 基础模型类的
    cli 模式
dbt run-operation generate_base_model --args '{"source_name": "raw_jaffle_shop", "table_name": "customers"}'

macro 引用

{{ codegen.generate_base_model(
    source_name='raw_jaffle_shop',
    table_name='customers',
    materialized='table'
) }}
  • create_base_models 重复执行基础模型的创建
    cli 模式
dbt run-operation codegen.create_base_models --args '{source_name: my-source, tables: ["this-table","that-table"]}'
  • generate_model_yaml 生成模型yaml 格式内容
    cli 模式
dbt run-operation generate_model_yaml --args '{"model_names": ["customers"]}'

macro 模式

{{ codegen.generate_model_yaml(
    model_names=['customers']
) }}
  • generate_model_import_ctes 生成cte 格式的模型sql 内容
    cli 模式
dbt run-operation generate_model_import_ctes --args '{"model_name": "my_dbt_model"}'

macro 模式

 {{ codegen.generate_model_import_ctes(
    model_name = 'my_dbt_model'
) }}

内部实现简单说明

dbt-codegen 实际上就是利用内部的一些context 方法处理的,以下只简单说明下generate_base_model 的处理

  • generate_base_model 内部处理
    参考代码
{% macro generate_base_model(source_name, table_name, leading_commas=False, case_sensitive_cols=False, materialized=None) %}
  # 标准的dispatch
  {{ return(adapter.dispatch('generate_base_model', 'codegen')(source_name, table_name, leading_commas, case_sensitive_cols, materialized)) }}
{% endmacro %}
 
{% macro default__generate_base_model(source_name, table_name, leading_commas, case_sensitive_cols, materialized) %}
# 获取soruce 的relation
{%- set source_relation = source(source_name, table_name) -%}
# 通过adapter 获取关系包含的列信息
{%- set columns = adapter.get_columns_in_relation(source_relation) -%}
 # 通过filter 获取列名称
{% set column_names=columns | map(attribute='name') %}
{% set base_model_sql %}
# 物化判断,默认是view 
{%- if materialized is not none -%}
    {{ "{{ config(materialized='" ~ materialized ~ "') }}" }}
{%- endif %}
# 此处包装类似我们编写模型的模式
with source as (
 
    select * from {% raw %}{{ source({% endraw %}'{{ source_name }}', '{{ table_name }}'{% raw %}) }}{% endraw %}
 
),
 
renamed as (
   # 通过获取的列进行cte 查询的包装
    select
        {%- if leading_commas -%}
        {%- for column in column_names %}
        {{", " if not loop.first}}{% if not case_sensitive_cols %}{{ column | lower }}{% elif target.type == "bigquery" %}{{ column }}{% else %}{{ "\"" ~ column ~ "\"" }}{% endif %}
        {%- endfor %}
        {%- else -%}
        {%- for column in column_names %}
        {% if not case_sensitive_cols %}{{ column | lower }}{% elif target.type == "bigquery" %}{{ column }}{% else %}{{ "\"" ~ column ~ "\"" }}{% endif %}{{"," if not loop.last}}
        {%- endfor -%}
        {%- endif %}
 
    from source
 
)
 
select * from renamed
{% endset %}
# 判断是否是执行环境
{% if execute %}
# 终端输出模型sql 信息,方便使用(比如重定向,或者复制)
{{ print(base_model_sql) }}
{% do return(base_model_sql) %}
 
{% endif %}
{% endmacro %}

说明

dbt-codegen 实际上也属于官方推荐的一个不错的dbt 包,可以快速的生成系统一些模型,加速开发

参考资料

https://docs.getdbt.com/reference/dbt-jinja-functions/print
https://github.com/dbt-labs/dbt-codegen

posted on   荣锋亮  阅读(39)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
历史上的今天:
2022-05-28 rrun+juicefs 进行nodejs 模块的运行
2022-05-28 nginx njs npm hashids 模块使用
2022-05-28 nginx njs 方便的cli 测试工具
2022-05-28 基于typescript 开发njs 模块的一个玩法
2020-05-28 VictoriaMetrics v1.36.0 的一些新功能
2019-05-28 Kapitan 通用terraform&& kubernetes 配置管理工具
2019-05-28 sqler 集成 terraform v0.12 生成资源部署文件

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示