DataVault模型实践
1.背景
数仓建模方法有很多种,各有千秋,可能比较常用的是维度建模或者大宽表的方式进行建模的比较多,DataVault模型用的比较少,特此通过例子来实践加深理解一下。
2.DataVault定义
Data Vault是一种数据仓库建模方法,最早由Dan Linstedt在20世纪90年代提出,主要应用于企业级数据仓库建模。不同于三范式数据仓库模型、维度模型,Data Vault模型主要用于存储来自多个业务系统的完整的历史数据,是一种中心辐射式模型。它不区分数据在业务层面的准确与否,装载数据也不做验证和清洗,因此,Data Vault模型可用于跟踪所有数据的来源。
它有三种表结构:
- 中心表——Hub唯一业务键的列表,唯一标识企业实际业务,企业的业务主体集合。
- 链接表——Link表示中心表之间的关系,通过链接表串联整个企业的业务关联关系。
- 卫星表——Satellite历史的描述性数据,数仓中数据的真正载体。
3.DataVault建模例子
以学生选课的例子来进行讲解,设计的相关应该如下。
中心表
hub_student-hub(学生实体)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
2021-07-14 Hive累加,日期缺失问题处理方式