KDT#48 再谈杂项维度(二)
有两种方法来建立杂项维度。第一种方法是事先生成杂项维度的所有记录,即对几个属性的每一种组合都生成一条记录。第二种方法是在ETL过程中遇到新的属性组合时生成记录。
如果杂项维度表中的记录数相对来说较少的话,我们可以采用第一种事先生成记录的方法。如果记录数相对来说较多的话,我们可以采用第二种在数据迁移时创建使用到的杂项维度记录的方法。
最近(Kimball)遇到的一个医疗的方面的杂项维度表,理论上应该有超过一万亿条记录,而实际上使用的记录只有几万条。很明显,这种情况不应该事先生成所有理论上有用的记录。如果杂项维度表中记录接近或超过相应事实表的记录数的话,这种设计就不可取了。
杂项维度表中的一条记录包含相应的多个属性值,它会自动记录维度表数据的变化。所以对于杂项维度表来说,我们不需要再考虑缓慢变化维的情况了。