专注于中国的商业智能

导航

数据仓库项目管理面试题整理(十三)

数据仓库架构

 

1.企业的数据仓库已经从50GB增长到了1TB。它最初仅有50个用户,而现在已增长到300个用户。系统的响应慢得吓人,用户怨声载道,DBA在数据仓库的扩展和性能方面遇到的极大的困难。所有的新需求都被置之不理。所有的一切都是由于最初的架构引起的,这个架构只考虑了50G空间和50个用户。而目前架构中的任何变化都将是高代价和破坏性的。面对这种局面,数据仓库设计师应该如何处理?

 

2.一家企业内有12个“数据仓库”,其实它们都是彼此独立的数据集市。这家企业坚决反对一个中央数据仓库。这12个数据仓库的所有者都希望自己能拥有数据的控制权。此外,这家企业没有命名约定,即使在每个数据仓库之中也是这样。现有的数据有一半以上没有元数据。面对这种情况,这家企业应该如何来集成和清理它的环境呢?

 

3.一家企业有个不好的习惯,就是有时需要回退事务。这些事务在实际发生后的一个月或者更长时间才进入系统。财务人员认为历史信息不应该改变,但是这家企业的数据仓库根据回退事务改变历史的数据值。这种做法合理吗?回退事务是否应该改变数据仓库中的历史信息呢?

 

4.一家企业正在设计一个点击流数据仓库,应用软件是CRM。他们正在征求设计这个超大型数据仓库方面的建议。他们应该考虑并行性和数据的划分方式吗?他们应该考虑RDBMS的任何具体特性吗?

 

5.一家企业有分析数据的历史变化情况的需求。DBA不想在事实表中重复的保存所有的事实,因为他们有大量的事实。他们正在使用OLAP工具自动生成SQL语句,但是他们发现用SQL处理时间变化情况并不是一个好办法。他们应该如何来做呢?

 

6.一家企业正处于实现一个新业务系统的过程中,并遇到了任何新系统所具有的常见问题。企业的管理层正竭力把一个数据仓库和这个业务系统同时建立,这个业务系统作为数据仓库的数据源。这样的开发方式可行吗?

 

7.一家企业正在进行数据仓库的开发。他们的策略是先适度的完成一个基于Web的报表制作系统,然后在交付后将另外的报表不断的添加上。但是这项策略彻底失败了,报表制作的需求像气球一样膨胀。目前数据仓库完全变成了一个报表制作系统。数据仓库团队应该如何来处理这种情况?

 

8.一家企业正处于指定一个数据仓库策略的论证阶段。软件选择委员会已经选定了许多来自不同开发商的产品。他们认为,元数据对他们的成功是至关重要的,但是他们同时也担心从多个源系统和开发商的产品集成元数据的能力。在多个源系统和开发商的产品之间管理一个统一的元数据是可能的吗?

 

9.一个零售商正在收集存储器中的销售单据数据。在单据中有诸如一包装有12听可以零售的罐头这样的数据,其中整包与单听有不同的UPC码。也就是说,分析师以单听粒度进行查询的话,他们就不能对整包销售进行分析。那么,数据仓库团队应该如何来处理这些数据呢?

 

 

本日志来源于Sid Adelman的著作Impossible Data Warehouse Situations。

posted on 2010-08-10 16:56  李梦蛟  阅读(1489)  评论(1编辑  收藏  举报