专注于中国的商业智能

导航

数据仓库项目过程管理

任何正规的信息化项目都少不了规范化的过程管理,而规范化的过程管理的依据就是文档。下面我总结一下我参与的数据仓库项目中,产生的中间文档。参考于宗民,刘义宁等人编著的《数据仓库项目管理实践》一书,推荐数据仓库小组的人都看看本书,虽然内容不是特别深入,但是书中提到的一些文档模板,可以比较好的规范数据仓库项目过程,也节约了自己定义项目管理过程文档的投入。

1.数据仓库系统规划说明书

主要描述该项目的业务目标,项目技术应用范围,以及项目的实施方法(包括人员组织架构问题)等问题;

2.业务需求说明书

描述一个一个具体的业务需求

3.软件需求分析说明书

根据业务需求说明书,对需求进行详细的分析,如说明数据来源,使用机构,展现方式,更新频率,权限要求等

4.初级数据质量评估报告

对需求的源系统中的数据进行抽样评估,找出质量不好的数据的过滤条件规则,以及补全不完整的数据等

5.数据采集需求说明书

根据业务需求分析出需要到源系统中哪些表中抽取哪些数据

6.数据采集程序设计说明书

详细的ETL程序的设计,包括从源系统到数据转存区的ETL和转存区到数据仓库的ETL。

7.数据仓库模型设计说明书

数据仓库表的设计,以及一些性能的考虑,比如分区表,索引等技术。

8.OLAP系统设计说明书

设计多维数据模型,详细到某个立方体包含哪些维度和度量值,以及维度的层次结构等。

9.数据仓库管理程序使用手册

主要是说明一些元数据管理,以及ETL程序的调度和调度策略。

10.数据仓库数据质量报告

数据仓库建设好,初始化以后,对其中的数据进行评估,看与业务是否有偏差,偏差有多大。

11.单元测试报告

针对每一个业务需求,进行单元测试,描述测试过程和结果。

12.手工补录数据设计说明书

在数据仓库项目中,往往用户会要求一些源系统不存在的数据,比如产品的二次分类,那么这个时候就需要手工补录数据了,个人认为,这种数据在数据仓库项目中越少越好,不是必要的,尽量避免,会增加很多不必要的麻烦,因为人工录入难免会存在一些错误。

13.集成测试报告

14.软件需求变更说明书

15.培训计划

以上是我们项目中采用了的文档,希望对学习数据仓库的朋友起到一定的参考作用。上面没有包括日常的会议记录和阶段性的项目总结。

 

posted on 2009-02-03 14:13  李梦蛟  阅读(1487)  评论(0编辑  收藏  举报