数据库设计三大范式
为了建立冗余较小、结构合理的数据库,设计数据库时必须遵循一定的规则。在关系型数据库中这样的规则就称为范式。范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库。必须满足一定的范式。
在实际开发中最为常见的设计范式有三个:
1.第一范式(确保每列保持原子性)
第一范式是最主要的范式。
假设数据库表中的全部字段值都是不可分解的原子值,就说明该数据库表满足了第一范式。
第一范式的合理遵循须要依据系统的实际需求来 定。比方某些数据库系统中须要用到“地址”这个属性。本来直接将“地址”属性设计成一个数据库表的字段就可以。可是假设系统常常会訪问“地址”属性中的“城 市”部分。那么就非要将“地址”这个属性又一次拆分为省份、城市、具体地址等多个部分进行存储,这样在对地址中某一部分操作的时候将很方便。
这样设计才算 满足了数据库的第一范式,例如以下表所看到的。
上表所看到的的用户信息遵循了第一范式的要求。这样在对用户使用城市进行分类的时候就很方便,也提高了数据库的性能。
2.第二范式(确保表中的每列都和主键相关)
第二范式在第一范式的基础之上更进一层。第二范式须要确保数据库表中的每一列都和主键相关,而不能仅仅与主键的某一部分相关(主要针对联合主键而言)。也就是说在一个数据库表中。一个表中仅仅能保存一种数据,不能够把多种数据保存在同一张数据库表中。
比方要设计一个订单信息表,由于订单中可能会有多种商品,所以要将订单编号和商品编号作为数据库表的联合主键。例如以下表所看到的。
订单信息表
这样就产生一个问题:这个表中是以订单编号和商品编号作为联合主键。
这样在该表中商品名称、单位、商品价格等信息不与该表的主键相关,而仅仅是与商品编号相关。所以在这里违反了第二范式的设计原则。
而假设把这个订单信息表进行拆分,把商品信息分离到还有一个表中,把订单项目表也分离到还有一个表中。就很完美了。例如以下所看到的。
这样设计,在很大程度上减小了数据库的冗余。假设要获取订单的商品信息,使用商品编号到商品信息表中查询就可以。
3.第三范式(确保每列都和主键列直接相关,而不是间接相关,也就是不能存在依赖)
第三范式须要确保数据表中的每一列数据都和主键直接相关,而不能间接相关。
比方在设计一个订单数据表的时候,能够将客户编号作为一个外键和订单表建立对应的关系。
而不能够在订单表中加入关于客户其他信息(比方姓名、所属公司等)的字段。
如以下这两个表所看到的的设计就是一个满足第三范式的数据库表。
这样在查询订单信息的时候。就能够使用客户编号来引用客户信息表中的记录,也不必在订单信息表中多次输入客户信息的内容。减小了数据冗余。
总结:
第一范式:1NF是对属性的原子性约束,要求属性具有原子性,不可再分解。
通俗的理解是。字段还能够再分吗?如过不能,则是符合1NF的设计。
第二范式:2NF是对记录的惟一性约束,要求记录有惟一标识,即实体的惟一性。
简单的解释,比方你和一个女生约会建立一张表。不用每条约会记录都记录她的身高、体重。将身高体重单独的存在一张表中供查询就可以。
第三范式:3NF是对字段冗余性的约束,即不论什么字段不能由其他字段派生出来,它要求字段没有冗余。
打个比方,比方评论表,假设你将用户ID,用户头像都放在这留言表中。就是不合适的了。用户头像是依赖于用户ID,而不依赖该评论。