专注于中国的商业智能

导航

KDT#65 为ETL系统做好文档记录

在建立和维护数据仓库系统时,不论你的ETL系统是采用ETL工具开发的还是自己手工开发的,对整个ETL系统的每一步做好详细记录都是至关重要的一份工作。随着时间的推移,建好的数据仓库也在不断发展,ETL系统也需要逐步改变,为了能尽快的适应新的情况的变化,完善的文档对快速理解系统的架构和实现的细节能起到非常大的作用。

ETL工具也可以自动做一些文档记录,但是对于维护一个数据仓库的良好运转来说,这是远远不够的。我们需要为ETL系统开发一套完整、一致的架构,并做好文档工作。

构建一个可维护的ETL系统的第一步是要仔细考虑一下我们正要做的事情。例如:如何将系统模块化,如何保证这些模块能结合成一个整体等等。我们应该在文档中将这整体的框架和步骤都详细的记录下来。

制作一些模板是一个很好的选择。这些模板应该明确的标识出ETL中每一份工作需要记录的相关信息。需要定制模板的工作包括抽取、转换、查找、一致性处理、变化维管理、最终交付的目标表等内容。这些模板应该定制的尽可能的详尽,而且应该关注于我们需要做那些事情,即包含的方面是否全,而不应该关注于具体事情的细节。

接着,我们应该使用这些模板详细的记录维度表、事实表等的实际内容。在对维度表和事实表进行记录时,要尽量保证不同的维度表的描述方式是类似的。这样,当别人看了第一个维度表后,很容易就可以看明白其他的维度表,对于事实表的记录也应该如此。如果ETL工具支持的话,可以给ETL系统添加更多的注释。

最后,也要利用好ETL工具能做一些文档功能的特点,作为ETL系统文档记录的补充。

posted on 2010-08-05 14:33  李梦蛟  阅读(262)  评论(0编辑  收藏  举报