随笔分类 - 数据仓库
摘要:什么是拉链表 拉链表,记录每条信息的生命周期,一旦一条记录的生命周期结束,就要重新开始一条新的记录,并把当前日期放入生效的开始日期; 如果当前信息至今有效,在生效结束日期中填入一个极大值(一般为9999-99-99) 为什么要建立拉链表? 拉链表适合于:数据会发生变化,但是大部分是不变的; 比如:订
阅读全文
摘要:聚集型事实表概念 数据仓库的性能是数据仓库建设是否成功的重要标准之一。 聚集主要是通过汇总明细粒度数据来获得改进查询性能的效果。通过访问聚集数据,可以减少数据库在响应查询时必须执行的工作量,能够快速响应用户的查询,同时有利于减少不同用户访问明细数据带来的结果不一致问题。尽管聚集能带来良好的收益,但需
阅读全文
摘要:累计快照事实表的概念 累积快照事实表用来表述过程开始和结束之间的关键步骤事件,覆盖过程的整个生命周期,通常具有多个日期字段来记录关键时间点, 当过程随着生命周期不断变化时,记录也会随着过程的变化而被修改。 设计过程 对于累积快照事实表,其建模过程和事务事实表相同,适用于维度建模的步骤。 下面详述淘宝
阅读全文
摘要:周期快照事实表概念 周期快照事实表以具有规律性的、可预见的时间间隔记录事实,时间间隔如每天、每月、每年等,简称“快照事实表” 快照事实表特性 用快照采样状态 快照事实表以预定的间隔采样状态度量。这种间隔联合一个或多个维度,将被用来定义快照事实表的粒度,每行都将包含记录所涉及状态 的事实。 现在以淘宝
阅读全文
摘要:事务事实表概念 事务事实表用来描述业务过程,跟踪空间或时间上某点的度量事件,保存的是最原子的数据,也称为“原子事实表“ 设计过程 任何类型的事件都可以被理解为一种事务。比如交易过程中的创建订单、买家付款,物流过程中的揽货、发货、签收,退款中的申请退款、申请小二介入等,都可以被理解为一种事务。 事务事
阅读全文
摘要:事实表设计 什么是事实表 事实表作为数据仓库维度建模的核心,紧紧围绕着业务过程来设计,通过获取描述业务过程的度量来表达业务过程,包含了引用的维度 和与业务过程有关的度量。 事实表中一条记录所表达的业务细节程度被称为粒度。 通常粒度可以通过两种方式来表述: 一种是维度属性组合所表示的细节程度 一种是所
阅读全文
摘要:什么是维度 维度是维度建模的基础和灵魂。在维度建模中,将度量称为“事实” ,将环境描述为“维度”,维度是用于分析事实所需要的多样环境。 例如,在分析交易过程时,可以通过买家、卖家、商品和时间等维度描述交易发生的环境。 什么是维度属性 **维度所包含的表示维度的列,称为维度属性。**维度属性是查询约束
阅读全文