专注于中国的商业智能

导航

KDT#78 迟到的维度记录

在数据迁移的过程中,可能会遇到由于各种原因而迟到的维度记录。它们有可能是比事实记录晚到的维度记录,也可能是维度属性变化了但是延迟提交给数据仓库的维度记录。

对于迟到的维度记录有几种处理策略。

第一种方案是,ETL系统可以在事实记录相关的维度记录到了之后再将该事实记录迁移入数据仓库中。这样做的缺点是,事实表的记录可能会不完全。

第二种方案是在维度表中建立一条“未知”的维度记录,对于迟到的维度,都将该“未知”维度的代理键做为相关事实表的外键。等迟到的维度到来后,在将建立好的维度的代理键更新到相关的事实表中。这样的做法需要ETL系统记住迟到维度相关的事实记录,等迟到维度到来时可以更新。

第三种方案是为迟到的维度记录直接在维度表中建立记录,读取事实表中的自然键,并分配代理键,关联到事实表中。当以后维度记录到来之后,再将详细的维度属性更新到该记录中。

对于维度属性变化了但是延迟提交给数据仓库的维度记录,处理的方法略为复杂,在以后进行讨论。

posted on 2010-08-05 14:36  李梦蛟  阅读(524)  评论(0编辑  收藏  举报