KDT#19 保证维度复制的正确
建立分布式数据仓库的关键是使用一致性维度。实现一致性维度最简单的办法就是使用完全相同的维度表。一致性维度比较复杂的情况是允许使用维度表的子集。以产品为例,有些部门的分析需求可能只是商标粒度,而不是细到产品粒度。这时需要通过产品维度表来实现商标维度表,而商标维度表要保证是产品维度表完全的子集。这样,商标维度表和产品维度表就是一致性的维度表。
使用一致性维度最大的好处就是可以在分布的数据集市中进行交叉探察操作。交叉探察也是分布式数据仓库中一个核心的概念,有了它我们才可以不必实现集中。而成功的将一致性维度复制到分布的数据集市中也是建立分布式数据仓库系统最为核心的一步。
如果不同数据集市的维度表的版本出现了差别,那么就会导致不同数据集市的交叉探察操作出现问题。
保证能正确实现维度复制的两个原则:
1.所有的数据集市必须同时复制同一个版本的维度表,这样才能保证不同的数据集市可以通过一致的维度属性进行交叉探察操作。
2.所有的数据集市必须重新刷新与维度表的数据变化相关的聚集数据,只有当这些聚集数据与它们的基本事实表一致后才可以提交给最终用户使用。
维度的复制问题处理的好坏,决定了分布式数据仓库的成功与否,在进行设计和实现时需要深思熟虑。