KDT#30 减小事实表的容量
早期的数据仓库构建思想是将所有能得到的数据都放入数据仓库,随着信息的爆炸,数据仓库的尺寸开始变得不可接受。有两种方法可以解决这个问题,一个是数据过滤减少进入数据仓库的数据,另一个就是通过合理的设计减小数据仓库存储空间。本文简单讨论一下第二种方法。
在维度建模的设计中,维度表占用的空间相比事实表要小很多,如何减小事实表的容量是采用第二种方法的关键。
通常有如下方法可以减小事实表的容量。
1. 将所有的自然关键字的外键都替换称整型或小整型的代理关键字。
2. 将时间戳都替换称整型或小整型的代理关键字。
3. 尽可能的将相关联的维度合并成一个超级维度。
4. 将低基数的小型维度合并成杂项维度。
5. 将文字型的描述信息移出事实表,建立事实维度。
6. 进可能的将长整型和浮点型事实替换成整型。
其中的第五条,目前的数据库都支持变长字符型字段,对于这种变长字符型字段的事实来说是不必建立事实维度的。