5. 业务数仓理论
一、表的分类
1.实体表:一个现实存在的业务对象(用户表)
2.维度表:对应一些业务状态(订单状态)
3.事务型事实表:一旦发生不会再变化(交易流水)
4.周期性事实表:随着业务发生不断产生的数据(订单)
二、同步策略
1.数据同步类型:全量表、增量表、新增及变化表
全量表:存储完整的数据
增量表:存储新增的数据
变化表:存储新增的数据和变化的数据
2.具体表具体分析
1.实体表同步策略
数据量小,全量表
2.维度表同步策略
数据量小,全量表
说明:
1.可能会变化的状态数据可以存储每日全量。
2.没变化的可以只存一份固定值。
3.事务型事实表同步策略
增量表
4.周期型事实表同步策略
新增表(create),变化表(operator)
本文来自博客园,作者:jsqup,转载请注明原文链接:https://www.cnblogs.com/jsqup/p/16293829.html
分类:
阿里云离线数仓
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?