【转】oracle范式与交叉表
范式下的Oracle数据库设计
数据关系的复杂性导致了表中数据冗余的存在,数据冗余增加了维护数据库的负担,也占用了大量的磁盘空间,直接造成性能下降。为了消除这些负面影响,就应该对数据库表格进行规范化,使其遵守一定的规则的,尤其是数据库设计范式。
关系必须是规范化的,简单说来,就是在结构表设计时,消除冗余性和不协调的从属关系。即每一个分量必须是不可分的数据项,但是这只是最基本的规范化。规范化理论就是研究如何将一个不好的关系模式转化为好的关系模式的理论,规范化理论是围绕范式而建立的。规范化理论认为,一个关系数据库中所有的关系,都应满足一定的规范(约束条件)。规范化理论把关系应满足的规范要求分为几级,满足最低要求的一级叫做第一范式(1NF),在第一范式的基础上提出了第二范式(2NF),在第二范式的基础上又提出了第三范式(3NF),以后又提出了BCNF范式,4NF,5NF,以及“域/关键字”范式。范式的等级越高,应满足的约束集条件也越严格。规范的每一级别都依赖于它的前一级别,例如若一个关系模式满足2NF,则一定满足1NF。
在Oracle上设计数据库时更要符合范式的要求,如果把一个不符合规范的数据库放在Oracle中,是不会突出Oracle的性能的,甚至是非常糟糕。
例如:学生的成绩表,我们一般都要求打印一目了然。
这也是符合1NF的,但如果是在数据库中定义的表结构也这样,则是不完善的,是有潜在冲突的。如要增加考试科目,就得更改表结构,特别是大学,专业多、科目多,而有些科目是选学的,这将会使表结构变得相当复杂,有多少科目就得有多少个科目的字段,有部分字段值必然为空;这个表是指某次测验的还是期中或期末考试的成绩呢?分辨不出,于是每一次成绩都要造一张类似的表,必然表格较多。不仅浪费大量的磁盘空间,还会给程序的编写带来极大的困难。
在数据范式理论的指导下,对数据库表格进行规范化,使其结构更合理,消除存储异常,使数据冗余尽量最小,便于插入、删除和更新,进一步保持了数据的完整性。经过探索,我在成绩管理系统的设计上采用了如下的表结构,这个表结构能以不变应用多变,不管是科目的增加,还是教师的变动,都能适应,符合数据的规范要求。
由此看出,经数据规范化的数据虽然使数据冗余小,便于插入、删除和更新,但如果直接输出是不符合人们观看习惯的,必需要把其输出为上面表1的格式才行,这就是列向表生成横向表的问题,即交叉表的生成。
交叉表的生成,参见文章:http://www.cnblogs.com/wzc998/archive/2010/08/24/1807410.html