建立多维数据集维度时应该注意的问题
多维数据与普通的关系型数据库中的二维数据重要的一个区别就是在维度上多了一些其他
维,也就是把更多的条件加入到了数据展现上去,所以说在多维数据集中的维度这一概念是
很重要的,很多时候我们刚接触到数据仓库,也许说成是数据集市更确切一些,也就是一些
初步的多维数据建立时,维度的选择方面可能都不是那么好定的,大多数的时间里我们都是
先定一些很明显能够看到的维度,也许还有很多对这个主题的多维数据有着紧密关系的维度
我们还没有想到,这个不用太急,我们可以先把这些零星的维度建立起来,然后再结合主题在
实际应用中到底要用到那些维度,在这个过程中把维度逐步完善。
不过在建立维度的过程中,很重要一点就是维度中的层次级别要搞清楚,这个我觉得有能含糊。
现在很多辅助建立数据仓库的工具都是根据你提供的维度自动进行维度中层次的搜索,如果你级
别没有选对,或者是级别的顺序搞反了,得出来的结果就会让你无法理解,明明在基础数据库中
的数据是正确的,为什么到了数据仓库中就出问题了呢?
一个很容易犯的错误就是自己的层次结构不分明,或者出现断层现象,这样的话工具在处理的时候
当然就会出现问题。我觉得在建立这些维度关系以及维度内部层次的划分时用UML工具或visio等把这些事先都
画出来,然后再进行事实表与维度表的建立,每次改动都最好能做个备份,这样以后出问题拿过画对照一下很多
问题都会迎刃而解了,另外对你在数据仓库建设方面很有帮助