数据库设计阶段中为何要考虑“反规范化”
在设计关系型数据库的时候,我们都会被告知,应该尽量地遵照范式(NF)的原则去做(范式,在有的时候也称为规划化),范式的主要目标就是减少冗余。冗余主要的问题是:重复的数据和增加了操作的复杂性。
但正如世界上很多的事情一样,数据库设计也不可能是生硬的。范式确实避免了冗余,但也带来了其他的问题,主要有两个问题
1. 性能问题。因为按照范式设计的时候,数据会被尽可能地拆分在不同的表格里面。这样的情况下,要找到一条完整的数据,就需要对多个表进行联接(join),这种操作毫无疑问地降低了速度。
2. 历史数据问题。例如员工都会有职称的信息,但是要考虑到员工的职称会变动。如果仅仅保留一个职称信息,在某些系统中就会有问题。所以这种情况下,我们就必须考虑记录员工职称变动的情况。
那么,如果为了解决上面两类问题,我们就可能要考虑“反规范化”,即允许部分的冗余。