随笔分类 -  dbt

1 2 3 4 5 ··· 8 下一页

dbt indexes 配置简单说明
摘要:dbt indexes 索引配置的目的是提升系统性能,为了方便维护dbt 提供了默认空实现,对于不同db 会有不同的实现,以下简单说明下 内部macro 定义 可以看到基本实现都为空,由具体的db adapter 实现 {% macro get_create_index_sql(relation, 阅读全文

posted @ 2024-07-24 07:37 荣锋亮 阅读(13) 评论(0) 推荐(0) 编辑

dbt 1.8 发布
摘要:就在最近,dbt 发布了1.8.0 版本,核心比较重要的功能是提供了单元测试的能力,同时是官方文档也进行了调整(以前是可以看到,但是是实际是不能使用的),完整的changelogs 可以查看github 信息 参考资料 https://docs.getdbt.com/reference/resour 阅读全文

posted @ 2024-07-23 08:00 荣锋亮 阅读(14) 评论(0) 推荐(0) 编辑

dbt dremio 自定义的几个macro 简单说明
摘要:关于自定义schema 以前简单说明过,实际上dbt 支持了好几个预留的macro,可以方便进行自定义,比如schema,database,aliases,target dbt dremio adapter 的几个自定义macro 实际上就是上边说的,schemas,aliases,database 阅读全文

posted @ 2024-07-22 08:00 荣锋亮 阅读(20) 评论(0) 推荐(0) 编辑

dbt dremio nessie create table branch 问题解决简单说明
摘要:以前是简单说明过解决方法,以下通过实际代码,说明下解决 dbt dremio 集成nessie 内部处理简单说明 注意目前说明的场景是基于nessie 作为数据库配置的,而不是dbt 标准的space 玩法 整体处理 如下图,实际上和业务模型的定义有关系,包含了view,以及table,当然还有属于 阅读全文

posted @ 2024-07-21 01:21 荣锋亮 阅读(17) 评论(0) 推荐(0) 编辑

dbt create table branch 问题
摘要:属于社区有人的一个提问,实际上dremio 支持对于nessie source 特定branch 的 table 的创建,而且源码也有信息,只是官方文档缺少说明 branch创建表参考测试 一个简单sql CREATE table dbtv4.myappv5 AT BRANCH prod as se 阅读全文

posted @ 2024-07-20 08:00 荣锋亮 阅读(13) 评论(0) 推荐(0) 编辑

dbt 编写自定义通用测试
摘要:以前简单介绍或dbt 的数据测试(包含了通用测试以及异常测试),通用测试可复用性比较高,是比较推荐的选择 而且通用测试的扩展能力也是比较强大的,可以直接引用模型,自定义配置 一个参考使用 version: 2 models: - name: orders columns: - name: order 阅读全文

posted @ 2024-06-19 07:14 荣锋亮 阅读(38) 评论(0) 推荐(0) 编辑

dbt dq-tools 数据质量工具
摘要:dbt dq-tools 数据质量工具,对于数据质量 dq-tools 围绕 Accuracy,Consistency,Completeness,Timeliness,Validity,Uniqueness这6个kpi 进行处理 包含的功能 存储测试结果到表中 创建方便数据质量的数据集市 提供bi 阅读全文

posted @ 2024-06-18 06:50 荣锋亮 阅读(43) 评论(0) 推荐(0) 编辑

dbt data class column 简单说明
摘要:以前有简单介绍过dbt的 data class里边实际上包含了relation 以及column 一些方便的api 可以直接在macro 中调用 relation 比较常用,column 直接使用的并不是特别多,以下简单说明下 内部包装 与dbt context 对象一样属于一个包装 参考定义 @c 阅读全文

posted @ 2024-06-17 08:00 荣锋亮 阅读(11) 评论(0) 推荐(0) 编辑

dbt_artifacts 包内部实现简单说明
摘要:以前对于dbt_artifacts 有过简单的介绍,以下从设计以及源码上分析下,方便学习使用 使用 dbt_artifacts 提供了不少macro 同时也提供了不少模型,比如stg 类型的以及dim,fact 类型的, 对于使用 dbt_artifacts 推荐的方法是是使用了dbt 的on-ru 阅读全文

posted @ 2024-06-16 07:05 荣锋亮 阅读(16) 评论(0) 推荐(0) 编辑

dbt 部分macro 中namespace的使用简单说明
摘要:比如在dbt adapter 中的snapshot_check_all_get_existing_columns 中就使用了namepace 这个对象,以下简单说明下 namespace 对象的作用 实际上就是进行跨scope 的数据共享,因为jinja2 每个block 中的设置的变量是不能跨范围 阅读全文

posted @ 2024-06-14 06:00 荣锋亮 阅读(15) 评论(0) 推荐(0) 编辑

dbt yaml selector 简单说明
摘要:dbt 基于yaml 的selector 实际上就是一个yaml 格式文件,我们在运行的时候可以指定一个配置好的selector 文件,这样实际运行的 时候就比较方便了 主要作用 清晰 方便版本控制 可重用 参考使用 配置 selectors.yml selectors: - name: night 阅读全文

posted @ 2024-06-13 06:15 荣锋亮 阅读(21) 评论(0) 推荐(0) 编辑

dbt seed 配置简单说明
摘要:dbt 的seed是进行一些初始化数据建模的,可以方便测试,或者在一些场景提供基础数据,dbt 对于seed 支持不少配置,比如seed 的schema 位置,csv 分隔符处理,seed 中数据类型定义,当然还有 一些dbt 的通用配置(比如tag,meta,tests),我以前简单说明过seed 阅读全文

posted @ 2024-06-12 05:38 荣锋亮 阅读(34) 评论(0) 推荐(0) 编辑

dbt select支持的方法简单说明
摘要:对于一个大型的dbt 项目,我进行按需选择模型还是很重要的,dbt 基于select 可以支持多样的选择方法 支持的模式 tag 模式 dbt run --select "tag:nightly" source 模式 dbt run --select "source:snowplow+" 资源类型模 阅读全文

posted @ 2024-06-11 06:10 荣锋亮 阅读(27) 评论(0) 推荐(0) 编辑

dbt macro kwargs 参考的使用
摘要:从机制上实际上属于jinja2 的功能,可以实现灵活的扩展能力 jinja2 macro 提供的几个变量 varargs 就类似python 的var 变量 kwargs 是实现了keywords 参数的变量,可以获取传递的keyword 信息(实际上就是一个字典) caller 是在使用call 阅读全文

posted @ 2024-06-10 07:13 荣锋亮 阅读(16) 评论(0) 推荐(0) 编辑

dbt exceptions 简单说明二
摘要:以前对于dbt 提供的exceptions namespace 方法进行了说明,实际是dbt 对于exceptions 细化的还是比较明确的,以前没详细说明 当前包含的exceptions 信息 exceptions_jinja.py CONTEXT_EXPORTS = { fn.__name__: 阅读全文

posted @ 2024-06-09 07:07 荣锋亮 阅读(9) 评论(0) 推荐(0) 编辑

dbt graph 上下文变量简单说明
摘要:dbt graph 上下文变量,包含了dbt 项目相关的nodes 信息(比如model,source,metrics,macros,tests,snapshots) 因为dbt 包含了不同的处理阶段,实际如果希望获取graph context 中的一些nodes 信息,注意执行的阶段,一般建议的玩 阅读全文

posted @ 2024-06-08 08:00 荣锋亮 阅读(12) 评论(0) 推荐(0) 编辑

dbterd 基于dbt artifacts 生成ERD 代码的工具
摘要:dbterd 基于dbt artifacts 生成ERD 代码的工具,内部是通过dbt-artifacts-parser 对于dbt 项目的元数据进行解析当然看到部分可能会使用dbt-core 的cli 包含的一些特性 支持多种模型格式的target 包含了dbml,mermaid,plant目录, 阅读全文

posted @ 2024-06-07 08:00 荣锋亮 阅读(16) 评论(0) 推荐(0) 编辑

从源码看dbt-loom 是如何开发dbt plugin的
摘要:以前简单介绍过dbt plugin 有一套明确的格式,实际上与dbt adapter 套路是类似的,以下从源码角度看看dbt-loom 的设计 dbt-loom 参考架构 从此图可以看出,dbt-loom 可以从其他地方获取dbt 的元数据(dbt cloud,本地文件,对象存储),之后基于此插件结 阅读全文

posted @ 2024-06-04 07:32 荣锋亮 阅读(26) 评论(0) 推荐(0) 编辑

dbt adapter dispatch 处理简单说明
摘要:以前是结合使用对于adapter 的dispatch 有过简单说明,以下结合源码分析下 内部参考处理 参考处理 def dispatch( self, macro_name: str, macro_namespace: Optional[str] = None, packages: Optional 阅读全文

posted @ 2024-06-02 08:00 荣锋亮 阅读(12) 评论(0) 推荐(0) 编辑

dbt dbt-audit-helper 包compare_relation_columns 处理简单说明
摘要:dbt dbt-audit-helper 包在进行compare_relation_columns处理的时候进行数据表列字段创建顺序的判断 参考使用 我按照test 处理的,同时进行的测试异常进行存储 使用 {{ audit_helper.compare_relation_columns( a_re 阅读全文

posted @ 2024-06-01 07:35 荣锋亮 阅读(8) 评论(0) 推荐(0) 编辑

1 2 3 4 5 ··· 8 下一页

导航