ETL架构师面试题
本部分的题目来自Kimball的ETL Toolkit著作,原著未直接给出答案。这里的中文题目和答案是我参考其原著按自己的理解整理而来的,仅供参考。对于其中不确切的地方,欢迎大家一起沟通。有兴趣的朋友可以直接阅读原著。
分析
架构
5.在数据准备区中允许使用的数据结构有哪些?各有什么优缺点?
6.简述ETL过程中哪个步骤应该出于安全的考虑将数据写到磁盘上?
抽取
9.简述直接连接数据库和使用ODBC连接数据库进行通讯的优缺点。
数据质量
建立映射
18.简述三种基本事实表,并说明ETL的过程中如何处理它们。
20.迟到的数据对事实表和维度表有什么影响?怎样来处理这个问题?
元数据
优化/操作
24.简述数据仓库中的表的基本类型,以及为了保证引用完整性该以什么样的顺序对它们进行加载。
26.如果ETL进程运行较慢,需要分哪几步去找到ETL系统的瓶颈问题。
实时ETL
原文出自Jerome的BI博客,网址是http://www.chinabi.net/blog/user1/lastwood/index.html