博客园 首页 私信博主 显示目录 隐藏目录 管理 动画

离线数仓 建模、表的类型分类

关系建模:遵循三范式 1.基本字段不可再分割 2.其他字段对主键完全依赖 3.其他字段间不存在传递依赖关系

维度建模:星型模型 雪花模型 星座模型   实体表 维度表(码表) 事实表

事实表的分类:事务型事实表 周期型快照事实表 累积型快照事实表

按数据同步分类: 全量表 增量表 同步新增及变化数据的表

周期、累积的区别:前者重写变化的数据,后者重写新增的及变化的数据

拉链表:保留了变化前的数据 可以保存必要冗余

每条记录是有周期变化的,全量同步数据太冗余,增量同步已结束的数据,体现不出周期变化,所以有了同步变化的数据,同步增新及变化的数据两种方式

 

posted @ 2022-06-15 09:22  CHANG_09  阅读(87)  评论(0编辑  收藏  举报