数据库设计的几个建议
本文导读:数据库设计是信息系统设计的基础,一个好的数据库设计在满足了软件需求之外,还要易维护、易扩充等等要求,还要考虑到数据的一致性、冗余性、访问效率,数据库设计包括:库的设计,表的设计,字段的设计,主键和外键的设计,索引设计,约束设计等等,下面介绍数据库设计的几个建议
一、一般好的数据库设计需要注意以下几点
1、一个好的数据库设计首先要满足用户的需求
所有信息系统最后都将提交给最终用户使用,对于这一点,相信大家都已经达成共识。但是准确地把握用户的需求是很难的,虽然各方面的专家已经从不同方面给出了解决方案,但是用户需求仍然是软件工程中最不确定的因素之一。
2、一个好的数据库设计要便于维护和扩充
为了应对用户需求的修改和添加,也为了满足各种不同的软硬件环境下系统的使用,大部分信息系统都不得不在其生命期中进行升级和调整。在这些升级、调整中,又有相当部分会涉及到数据库设计的修改,因此,数据库设计最好从一开始就能在易维护、可扩充的角度多加斟酌。
(1)、不要为各种编号字段的设定固定的意义
而是最好通过对照表来建立这种编号和意义的对照关系。举例来说,很多设计者习惯给部门信息给出固定的编号,这种设计有个致命的缺陷:那就是由于这种对照关系既然不体现在数据库中,就必然要用业务逻辑来进行解释,这样一来,一有新的调整就不得不更新业务逻辑代码,也就非常容易不一致的错误。
(2)、枚举信息要体现在相应在对照表中
而不是体现在使用该信息的表中的值字段,这样做的好处是当用户希望用该枚举信息作为查询条件的时候,通过参照表的方式可以很容易的建立这些信息,另外也避免了当多个表格中都含有该枚举信息有可能引起的不一致。
3、用关联表建立表和表之间的多对多关系
而不要用一个字段解析的方式进行,举例来说,为了描述用户(UserInfo)和角色(RoleInfo)之间的关联关系,我们要建立对照表UserInfo_RoleInfo,而不要试图在用户表中建立一个较长的字段,如Roles(用RoleID1; RoleID2...的形式构成)来代替,因为这样一来字段解释需要在业务代码相应的解析代码,二来由于Roles定长,无法满足用户角色的扩充。
3、一个好的数据库设计要具有“可读性”
如同编程书籍中反复强调的程序员一定要在代码的可读性方面下功夫一样,考虑到信息系统将来的升级和维护可能要要由另外一批人来进行,因此数据库设计必然也要具有可理解性。
(1)、用设计文档来提高数据库设计的可读性
这点基本对应于“可读性”代码里面的注释。在一个合格的数据库设计文档中必须给出数据库中的每个表、每个字段、表间的关联关系以及各种约束的意义以及由来,从而有可能让开发者根据用户需求和设计文档就能理解正确数据库的设计。
(2)、给表和视图起一个有意义的名字
这点对应于coding规范中的变量和函数的命名,很显然,CustomerInfo的名字很容易联想到该表中含有客户信息,而把它命名为Table0001只能让人感到费解外。另外,如果DBMS提供表和视图名的大小写支持,该名称最好由每个构成单词(首字母大写)拼接而成。
(3)、用前缀给出表和视图内容之外的其他信息
如给参照表Ref_前缀,这样就可以让业务逻辑实现人员根据表的名字知道他所要操作的是不是张参照表,从而帮助他更快地理解详细设计,并有可能及早发现里面的错误。同样,给所有视图加上V_前缀,就可以让业务逻辑编程者很容易地知道他现在面临的是一个表还是视图,从而避免了对视图进行更新操作这种低级的错误。
(4)、给每一个字段起一个有意义的名字
如给CustomerInfo表中的电子邮件字段起名EMail让人很容易明白它的准确含义,而Field05则让人不知所云。基于同样的道理,数据库设计中也不能给字段起一个张冠李戴的名字。
(5)、字段命名要考虑上下文
举例来说,在UserInfo表中,用UserName来表示用户名字段就不如Name来的更加合适。这种情况画蛇添足的情况在对照表的设计中体现得尤为明显,如把部门对照表(Ref_Department)中的部门ID字段命名为DepartmentID,把部门名称字段命名为DepartmentName等等。
(6)、视图的设计不要牵扯到其他视图
与代码设计中函数调用最好不要嵌套过多层次相对应,为了便于数据库设计的阅读人能够很好地理解设计,视图最好直接建立在表上。
(7)、同一表中的记录最好不要相互引用
这种引用关系不仅让数据库设计的阅读人云里雾里,也不便于业务逻辑代码的编写。
(8)、关联表的命名用关联的表名中间加下划线连接构成
如学生(StudentInfo)和课程(CourseInfo)的关联表起名StudentInfo_CourseInfo。
4、一个好的数据库设计能够满足空间和效率的要求
对于一个信息系统来说,在实现用户需求的基础之上,保证一个较低的空间占用以及短的响应时间都是理智的客户所愿意看到的。那么在这一方面,数据库设计又要做些什么工作呢?
(1)、使用varchar而不要使用char字段
对于不定长信息如用户的简介信息,varchar的使用可以减少近一半的空间占用。当然这点不能一概而论,如用相应长度的char存储定长文本数据就比varchar来的合适。
(2)、不要使用BLOB字段存放“大数据”
BLOB字段诚如其名,本身是为存储二进制大数据而出现的,同样的道理也适用于某些DBMS所引入的TEXT字段。因为对于一般信息系统而言,最长的字段往往是一些描述文本信息,而DBMS对char/varchar的长度基本能满足这种需求。因此积极建议设计者对一些貌似很长的文本的最大允许长度进行确认,在此基础上参照DBMS中的开发手册来决定是否采用大字段。
(3)、不要使用设计器缺省的字段长度
这种做法一方面纵容了设计者对用户需求的一知半解以及对设计敷衍了事的不良习惯,另外一方面也在数据的存储上浪费了不少的空间,因为使用缺省字段长度的情况往往发生在字段上。
(4)、不要轻易使用unicode文本字段
DBMS对unicode的支持在帮助产品国际化的同时,也在一定程度上带来空间上的浪费,尤其是在当要存储的文本中的基本都是ASCII字符的情况下,这种浪费尤为明显。因此,建议设计者在选择unicode的理由,一定是出于国际化的考虑,而不是其他。因为大多数的大字符集和ASCII字符并存情况下所要碰到的问题基本上都已经由DBMS提供商解决。
(5)、使用预计算表来提高响应速度
跟数据仓库里面的某些思路相似,当业务逻辑中需要用倒根据历史信息得来的统计数据时,最好由独立于系统的预计算模块或相应的DW工具定期完成这些统计数据的预计算。
5、一个好的数据库设计可以简化业务逻辑的设计
所有的数据库设计都不是孤立的,它通过相应的业务逻辑实现(三层结构中还有表现层)来形成最终的产品,因此一个好的数据库设计应该能够帮助降低业务逻辑的编写难度,最起码不要给业务逻辑的设计、编码带来额外工作。
(1)、所有允许为空的字段必须是基于用户需求,而不是出于设计上方便的考虑。
这样带来的好处是让详细设计中的某些错误和疏漏(如在设计中没有考虑对非空字段的内容检查)在编码和单元测试阶段就被发现,从而避免了进一步扩散,有助于提高软件的质量。
(2)、不要业务逻辑代码实现唯一性约束
对数据库表中的某些字段(或者多个字段的组合)的唯一性约束应该尽可能地加到数据库端。因为这种约束工作交给业务逻辑中去实现代价高昂而且不可靠。
(3)、关联约束一定要建立在数据库端
分析出设计中所涉及的主外键引用关系并体现在数据库设计中。这一条出于两点考虑:降低业务逻辑的编写难度和数据关联性约束的要求。
二、数据库设计的几个建议
1.使用明确、统一的标明和列名,例如 School, SchoolCourse, CourceID。
2.数据表名使用单数而不是复数,例如 StudentCourse,而不是StudentCourses。
3.数据表名不要使用空格。
4.数据表名不要使用不必要的前缀或者后缀,例如使用School,而不是TblSchool,或者SchoolTable等等。
5.数据库中的密码要加密,到应用中再解密。 (其实就是散列存储、单向加密)
6.使用整数作为ID字段,也许现在没有这个必要,但是将来需要,例如关联表,索引等等。
7.使用整数字段做索引,否则会带来很大的性能问题 。
8.使用 bit 作为布尔字段,使用整数或者varcha是浪费。同时,这类字段应该以“Is”开头。
9.要经过认证才能访问数据库,不要给每一个用户管理员权限。
10.尽量避免使用“select *”,而使用“select [required_column_list]”以获得更好的性能。
11.假如程序代码比较复杂,使用ORM框架,例如hibernate,iBatis。ORM框架的性能问题可以通过详细的配置去解决。
12.分割不常使用的数据表到不同的物理存储以获得更好的性能。
13.对于关键数据库,使用安全备份系统,例如集群,同步等等。
14.使用外键,非空等限制来保证数据的完整性,不要把所有的东西都扔给程序。
15.缺乏数据库文档是致命的。你应该为你的数据库设计写文档,包括触发器、存储过程和其他脚本。
16.对于经常使用的查询和大型数据表,要使用索引。数据分析工具可以帮助你决定如何建立索引。
17.数据库服务器和网页服务器应该放在不同的机器上。这回提高安全性,并减轻CPU压力。
18.Image和blob字段不应该定义在常用的数据表中,否则会影响性能。
19.范式(Normalization)要按照要求使用以提高性能。Normalization做的不够会导致数据冗余,而过度Normalization 会导致太多的join和数据表,这两种情况都会影响性能。
20.多花点时间在数据库设计上,否则你将来会付出加倍的时间来偿还