数据仓库之架构发展
数据仓库有很多类型的架构方式,按照发展的历程上,主要有如下几类标志性。
- 独立的数据集市架构。 在最早期的数据仓库建设中,大多是以部门为单位搭建数据仓库,也就是数据集市,供整个部门使用。这样能够很快的构建好数据仓库,但是缺点是很容易产生不同部门因数据计算口径不同而导致的数据产出结果不一致。当然对于小公司来讲,构建一个公司级的数据集市也是能够满足需求的。
- 联邦式的数据仓库架构。不同的部门构建出不同的数据集市,数据集市之间不能很好的进行整合,只能通过建立一定的映射关系来进行数据的交换,所以通过构建这种数据集市之间的映射关系来建设数据仓库就是联邦式的数据仓库架构。
- 集中式的数据仓库架构。随着数据仓库架构的发展,集中式的数据仓库集市的产生标志着数据仓库的发展进入了一个成熟期。集中式的数据仓库就是将公司的所有的数据都集中到EDW中,所有的用户都直接访问EDW的数据来做应用和分析。ROLAP的发展也促使着集中式的数据仓库架构更加的流行。ROLAP就是以EDW的数据模型为基础,保存维度模型的关系来进行OLAP分析。
- 集线器(企业信息工厂)-Inmon-自上而下的数据仓库架构。随着数据量越来越大,集中式的数据仓库架构EDW很难满足OLAP的需求,所以需要在EDW之上建设新的一层数据模型,也就是数据集市。这样的数据集市是面向主题的,数据经过了汇总,数据量下降,方便用户的使用。缺点是数据集市之间还是不能进行数据交换。【范式建模】
- 总线-Kimball-自下而上的数据仓库架构。总线架构跟集线器架构最大的不同是,直接通过建设数据集市和一致维度来作为数据仓库。【维度建模】
- 复合式架构。结合集线器和总线架构。
参考资料