数据库三大范式详解

刚百度百科看了下  目前数据库范式加起来共有六种了;即第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。越往后数据库的冗余就越小。

先来看第一范式:看下百度百科定义:

所谓第一范式(1NF)是指在关系模型中,对于添加的一个规范要求,所有的域都应该是原子性的,即数据库表的每一列都是不可分割的原子数据项,而不能是集合,数组,记录等非原子数据项。即实体中的某个属性有多个值时,必须拆分为不同的属性。在符合第一范式(1NF)表中的每个域值只能是实体的一个属性或一个属性的一部分。简而言之,第一范式就是无重复的域。
说明:在任何一个关系数据库中,第一范式(1NF)是对关系模式的设计基本要求,一般设计中都必须满足第一范式(1NF)。不过有些关系模型中突破了1NF的限制,这种称为非1NF的关系模型。换句话说,是否必须满足1NF的最低要求,主要依赖于所使用的关系模型
我批注一下我个人的理解:所谓所有域都是原子表示每个列不能再拆分。
比如有这样的一张表
ID  | 用户姓名| sex| age|所在区域...
这样一张用户表 很简单的几个列名  但如果一开始这样设计其实是不符合第一范式的。因为区域这个字段,其实非常笼统  详细分话其实还可以分 省  市  区  甚至街道。所以这样的表设计不符合第一范式
 
第二范式:
再看百科的定义:
在1NF的基础上,非码属性必须完全依赖于候选码(在1NF基础上消除非主属性对主码的部分函数依赖)
第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或记录必须可以被唯一地区分。选取一个能区分每个实体的属性或属性组,作为实体的唯一标识。例如在员工表中的身份证号码即可实现每个一员工的区分,该身份证号码即为候选键,任何一个候选键都可以被选作主键。在找不到候选键时,可额外增加属性以实现区分,如果在员工关系中,没有对其身份证号进行存储,而姓名可能会在数据库运行的某个时间重复,无法区分出实体时,设计辟如ID等不重复的编号以实现区分,被添加的编号或ID选作主键。(该主键的添加是在ER设计时添加,不是建库时随意添加)
第二范式(2NF)要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。为实现区分通常需要为表加上一个列,以存储各个实例的唯一标识。简而言之,第二范式就是在第一范式的基础上属性完全依赖于主键
 
说明:这个第一范式是在第一范式的基础上才成立的 ,这个是前提。第二这个范式明确了数据库表中的记录必须有一个唯一标识的属性用来区分记录。【所以数据不能出现冗余,重复!!!】
先看下如下表结构设计 :
ID|订单编号|房间号|联系人|联系人手机|联系人电话号码
根据业务  这里有一种情况 如果一个人同时预订了几个房间  那么从记录结果的角度来讲 可能存在数据冗余 即一个人订购了多个房间后 显示多个相同的姓名 手机号  电话号码信息,所以一般做法是将联系人,联系人手机,联系人号码单独独立出去,主表以一个联系人ID作为与另一张外键表关联。
上述例子中如果根据百科的理解其实是这张表中没有一个能区分唯一的属性,一个人可以同时订N个房间,订单号 房间号 都会不同,但联系人相关信息确是唯一的 所以这里需要建立一个候选键,至于该键相关的其他属性都可以分离出去做到属性完全依赖主键。
 
第三范式:
在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)
第三范式(3NF)是第二范式(2NF)的一个子集,即满足第三范式(3NF)必须满足第二范式(2NF)。简而言之,第三范式(3NF)要求一个关系中不包含已在其它关系已包含的非主关键字信息。例如,存在一个部门信息表,其中每个部门有部门编号(dept_id)、部门名称、部门简介等信息。那么在员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。简而言之,第三范式就是属性不依赖于其它非主属性,也就是在满足2NF的基础上,任何非主属性不得传递依赖于主属性。
这个范式强调 字段不能有传递性设计。比如 文中讲的  
员工ID|员工其他信息。。。|部门ID|部门名称|部门简介
这张表员工ID及员工相关信息加上部门ID其实是一个整体  如果此时加上部门ID之后的信息 就违反了属性依赖于其他非主属性的情况 应该单独分离。目的还是做到数据尽量不冗余
 
 
实际情况是适当的冗余是在所难免的。比如订单类型的表  其实 除了购买商品ID外 商品名字一般也会冗余进去  而且这样设计也是合理的  一般顾客更关心的是下单那个时候的商品名  也行以后商品名会被更改 但下单那一刻 下次顾客自己的订单列表  顾客只认下单那的商品名  不然会让人不可理解与错误!
 
所以并不是一定要完全遵守三大范式  但请在做表结构设计时 还是先充分考虑它  除非特殊情况特殊对待
 
 
posted @ 2018-11-18 17:42  陶朱公Boy  阅读(2131)  评论(0编辑  收藏  举报