【转】范式
【第一范式 1NF】
定义:表中每一条记录的每个一个字段值,都是不可再分的最小数据单位。
解释:例如,(工号,姓名,电话号码)组成一个表,由于一个人可能有办公电话和家庭电话,因此该表不符合1NF,规范成为1NF有三种方法:
重复存储工号和姓名,主键只能是电话号码;
工号为主键,把电话号码分解为“单位电话”和“住宅电话”两个属性;
工号为主键,但强制每条记录只能有一个电话号码。
以上三个方法,第一种方法最不可取,按实际情况选取后两种情况。
【第二范式 2NF】
定义:在满足1NF的基础上,每一个非主键字段必须完全依赖于主键。只有在复合字段作主键时,才可能出现不满足2NF的情况。
解释:例如,(学号,课程号,学分,成绩)组成一个表,主键为(学号,课程号)。 在应用中使用该表时可能存在以下问题:
数据冗余:假设同一门课由40个学生选修,学分字段就重复40次;
更新异常:若调整了某课程的学分,学分字段的值都要更新,有可能会出现同一门课学分不同;
插入异常:如果开设新的课程,由于还没人选修(主键中少了学号),只能等有人选修才能把新开设的课程和学分存入。
删除异常:若学生已经结业,从当前数据库删除选修记录。某些门课程新生尚未选修,则此门课程及学分记录无法保留。
存在以上问题的原因是,非主键字段“学分”仅“部分依赖”于主键(学号,课程号),也就是“学分”字段仅函数依赖于“课程号”字段。该表存在部分依赖的字段“学分”。
解决方法:采用纵向分表,将部分依赖的字段抽出来建立一个新表,该表可分解为(学号,课程号,成绩)和(课程号,学分)两个表,两个表之间通过“课程号”作为外键关联。
【第三范式 3NF】
定义:在满足1NF和2NF的基础上,所有非主键字段对任何主键字段都不存在传递依赖。
解释:例如,(学号,学生姓名,系号,系名,系地址)组成一个表,主键为(学号),由于主键是单个字段,因此没有部分依赖的问题,肯定满足2NF。但是,在应用中使用该表时可能存在以下问题:
存在大量的冗余,有关学生所在的几个字段(系号,系名,系地址)将会重复重复存储。
存在以上问题的原因是,存在传递依赖而造成,“学号”能够决定“系号”,“系号”能够决定“系地址”,“学号”不能够直接决定“系地址”,因此“学号”对“系地址”的函数决定是通过传递依赖“系号->系地址”实现的。
解决方法:采用纵向分表,将存在传递依赖的字段抽出来组成新表,该表可分为(学号,学生姓名,系号)和(系号,系名,系地址)两个表,两个表之间通过“系号”关联。
定义:表中每一条记录的每个一个字段值,都是不可再分的最小数据单位。
解释:例如,(工号,姓名,电话号码)组成一个表,由于一个人可能有办公电话和家庭电话,因此该表不符合1NF,规范成为1NF有三种方法:
重复存储工号和姓名,主键只能是电话号码;
工号为主键,把电话号码分解为“单位电话”和“住宅电话”两个属性;
工号为主键,但强制每条记录只能有一个电话号码。
以上三个方法,第一种方法最不可取,按实际情况选取后两种情况。
【第二范式 2NF】
定义:在满足1NF的基础上,每一个非主键字段必须完全依赖于主键。只有在复合字段作主键时,才可能出现不满足2NF的情况。
解释:例如,(学号,课程号,学分,成绩)组成一个表,主键为(学号,课程号)。 在应用中使用该表时可能存在以下问题:
数据冗余:假设同一门课由40个学生选修,学分字段就重复40次;
更新异常:若调整了某课程的学分,学分字段的值都要更新,有可能会出现同一门课学分不同;
插入异常:如果开设新的课程,由于还没人选修(主键中少了学号),只能等有人选修才能把新开设的课程和学分存入。
删除异常:若学生已经结业,从当前数据库删除选修记录。某些门课程新生尚未选修,则此门课程及学分记录无法保留。
存在以上问题的原因是,非主键字段“学分”仅“部分依赖”于主键(学号,课程号),也就是“学分”字段仅函数依赖于“课程号”字段。该表存在部分依赖的字段“学分”。
解决方法:采用纵向分表,将部分依赖的字段抽出来建立一个新表,该表可分解为(学号,课程号,成绩)和(课程号,学分)两个表,两个表之间通过“课程号”作为外键关联。
【第三范式 3NF】
定义:在满足1NF和2NF的基础上,所有非主键字段对任何主键字段都不存在传递依赖。
解释:例如,(学号,学生姓名,系号,系名,系地址)组成一个表,主键为(学号),由于主键是单个字段,因此没有部分依赖的问题,肯定满足2NF。但是,在应用中使用该表时可能存在以下问题:
存在大量的冗余,有关学生所在的几个字段(系号,系名,系地址)将会重复重复存储。
存在以上问题的原因是,存在传递依赖而造成,“学号”能够决定“系号”,“系号”能够决定“系地址”,“学号”不能够直接决定“系地址”,因此“学号”对“系地址”的函数决定是通过传递依赖“系号->系地址”实现的。
解决方法:采用纵向分表,将存在传递依赖的字段抽出来组成新表,该表可分为(学号,学生姓名,系号)和(系号,系名,系地址)两个表,两个表之间通过“系号”关联。