数据仓库常见面试问题

https://blog.csdn.net/kangkanggegeg/article/details/79373551

数据仓库主要工作就是模型设计;

1、数仓建模方法:范式建模、维度建模、Data Vault; 各自优缺点?

2、维度建模的三种方式:星型模式、雪花模式、星座模式

3、分层架构:ODS、DW(DW数据分层,由下到上为 DWD,DWB,DWS)、ADS

4、缓慢变化维与退化维;处理缓慢变化维的方式(拉链表,拉链表能实现保存历史快照,去除重复数据,节约空间)

5、维度建模过程?

 

6、事实表有哪些?各自含义?

事务型事实表(其中事务的含义?

一行数据。 一旦事务被提交,事实表数据被插入,数据就不再进行更改,其更新方式为增量
更新。

事实的含义?--术语表示的是业务事件的 度量值 (可统计次数、个数、 件数、 金额等)

周期型事实表

不会保留所有数据 只保留固定时间间隔的数据 ,例如每天或者每
月的销售额,或每月的账户余额等。稠密(例如当天没发生交易,也会记录数据)

累积型事实表

累计快照事实表用于 跟踪 业务事实 的变化。 例如,数据仓库中可能需要累积或者存储订

单从下订单开始,到订单商品被打包、运输、和签收的各个业务阶段的时间点数据来跟踪订
单声明周期的进展情况。当这个业务过程进行时,事实表的记录也要不断更新。

参考https://blog.csdn.net/liu_changshen/article/details/105958167

posted @ 2020-03-10 09:48  再见傅里叶  阅读(1343)  评论(0编辑  收藏  举报