数仓中的全量表、增量表、拉链表、流水表、快照表
全量表:每天的所有写最新状态的数据
1、有无变化,都要报
2、每次上报的数据都是所有的数据(变化的+没有变化的)
增量表:新增的数据
1、增量表,只报变化量,无变化不用报
拉链表:
1、记录一个事物从开始,一直到当前状态的所有变化的信息
2、拉链表每次上报的都是历史记录的最终状态,是记录在当前时候的历史总量
流水表:对于表的每一个修改都会记录,可以用户反映实际记录的变更
1、拉链表通常是对账户信息的历史变动进行处理保留的结果,流水表是对每天的交易形成的历史
2、流水表用于统计业务相关情况,拉链表用于统计账户及客户的情况
快照表:数据包含前一天的全量数据,按照每一天进行分区
每天坚持学习1小时