数据仓库
《数据仓库》:https://pan.baidu.com/s/1eSms3h4
《数据仓库生命周期工具箱》:https://pan.baidu.com/s/1sli8m4H
1、自上而下模式和自下而上模式
DW->DM:Bill Inmon 方法将数据仓库放置在第三范式(非维度形式)中,用户需要查询数据集市,而不是数据仓库。在这种方法中,数据集市具有维度的性质。但是,它们可能具有也可能没有Kimball 所说的一致的维度。
DM->DW:Ralph Kimball 很早就发现了卡壳的问题。如果企业中存在多个使用不同的方式识别和存储数据的独立系统,那么就会出现卡壳问题。尝试连接这些系统或者在数据仓库中使用其数据会产生一种类似于化简为繁的设备的东西。为了解决这种问题,Kimball 提倡使用一致的维度。所谓一致,指的就是特定的维度(例如销售情况)在各个数据集市中应该具有相同的特性和汇总。或者,至少一个数据集市中的特性和汇总应该是另一个数据集市中的特性和汇总的子集。按照这种方式,可以根据数据集市构成数据仓库。Kimball 方法的真正要旨在于,数据仓库包含维度数据库以便于进行分析,而且用户可以直接查询数据仓库。
2、第三范式建模和维度建模
3、事实表和维度表
4、星型模式和雪花型模式