第一范式(1NF):强调的是列的原子性,即列不能够再分成其他几列。
个人理解:列不可分(原子性,即字段不可以再分)
地址可以再分,分成省份,城市,和详细地址
第二范式(2NF):首先是 1NF,另外包含两部分内容,一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。
个人理解:不存在部分依赖(唯一性,不可以把多种数据保存在同一张表中,即一张表只能保存“一种”数据)
表: 学号, 姓名, 年龄, 课程名称, 成绩, 学分
问题:
数据冗余,每条记录都含有相同信息;
删除异常:删除所有学生成绩,就把课程信息全删除了;
插入异常:学生未选课,无法记录进数据库;
更新异常:调整课程学分,所有行都调整。
这个表有两个事务:学生信息, 课程信息;由于非主键字段必须依赖主键,这里学分依赖课程号,姓名依赖与学号,所以不符合二范式。
正确做法:
学生:Student(学号, 姓名, 年龄);
课程:Course(课程名称, 学分);
选课关系:StudentCourse(学号, 课程名称, 成绩)。
第三范式(3NF):首先是 2NF,另外非主键列必须直接依赖于主键,不能存在传递依赖。即不能存在:非主键列 A 依赖于非主键列 B,非主键列 B 依赖于主键的情况。
个人理解:不存在传递依赖(直接性,每一列都和主键直接相关,而不能间接相关)
表: 学号, 姓名, 年龄, 学院名称, 学院电话
问题:
数据冗余:有重复值;
更新异常:有重复的冗余信息,修改时需要同时修改多条记录,否则会出现数据不一致的情况
因为存在依赖传递: (学号) → (学生)→(所在学院) → (学院电话) 。
正确做法:
学生:(学号, 姓名, 年龄, 所在学院);
学院:(学院, 电话)。