离线数仓 建模、表的类型分类
关系建模:遵循三范式 1.基本字段不可再分割 2.其他字段对主键完全依赖 3.其他字段间不存在传递依赖关系
维度建模:星型模型 雪花模型 星座模型 实体表 维度表(码表) 事实表
事实表的分类:事务型事实表 周期型快照事实表 累积型快照事实表
按数据同步分类: 全量表 增量表 同步新增及变化数据的表
周期、累积的区别:前者重写变化的数据,后者重写新增的及变化的数据
拉链表:保留了变化前的数据 可以保存必要冗余
每条记录是有周期变化的,全量同步数据太冗余,增量同步已结束的数据,体现不出周期变化,所以有了同步变化的数据,同步增新及变化的数据两种方式