第十二周学习笔记

第十二周学习笔记

本周主要讲解了数据库存储结构:页、聚集索引、非聚集索引。

一、SQL Server数据库的存储结构

SQL Server数据库存储结构的最小单位是页,大小为8K,共8 * 1024 = 8192Byte,不论是数据页还是索引页都是以此方式存放。实际上对于SQL Server数据库而言,其页(Page)类型有很多种。

所有数据页的存放在磁盘上又有两种组织方式:即堆表和索引组织表。如果表中所有数据页是以一种页间无序、随机存储的方式,则称这样的表为堆表;否则如果表中数据页间按某种方式(如表中某个字段)有序地存储与磁盘上,则称为索引组织表。

 

二、聚集索引

聚集索引确定表中数据的物理顺序。聚集索引类似于电话簿,后者按姓氏排列数据。由于聚集索引规定数据在表中的物理存储顺序,因此一个表只能包含一个聚集索引。但该索引可以包含多个列(组合索引),就像电话簿按姓氏和名字进行组织一样。 
    聚集索引对于那些经常要搜索范围值的列特别有效。使用聚集索引找到包含第一个值的行后,便可以确保包含后续索引值的行在物理相邻。例如,如果应用程序执行 的一个查询经常检索某一日期范围内的记录,则使用聚集索引可以迅速找到包含开始日期的行,然后检索表中所有相邻的行,直到到达结束日期。这样有助于提高此 类查询的性能。同样,如果对从表中检索的数据进行排序时经常要用到某一列,则可以将该表在该列上聚集(物理排序),避免每次查询该列时都进行排序,从而节省成本。 
    当索引值唯一时,使用聚集索引查找特定的行也很有效率。例如,使用唯一雇员 ID 列 emp_id 查找特定雇员的最快速的方法,是在 emp_id 列上创建聚集索引或 PRIMARY KEY 约束。

例如: 比如图书馆新进了一批书。那么这些书需要放到图书馆内。书如何放呢?一般都有一个规则,杂志类的放到101房间,文学类的放到102房间,理工类的放到103房间等等。这些存储的规则决定了每本书应该放到哪里。而这个例子中聚集索引为书的类别。 正是因为这种存储规则,才导致聚集索引的唯一性。

误区:有的人认为,聚集索引的字段是唯一的。这是因为sql server 中添加主键的时候,自动给主键所在的字段生成一个聚集索引。所以人们会认为聚集索引所加的字段是唯一的。 思考一下上面这个问题。杂志类的书放到101房间。那么如果杂志类的书太多,一个101房间存放不下。那么可能101,201两个房间来存放杂志类的书籍。如果这样分析的话,那么一个杂志类对应多个房间。放到表存储的话,那么这个类别字段 就不是唯一的了。

 

三、非聚集索引

该索引中索引的逻辑顺序与磁盘上行的物理存储顺序不同。

索引是通过二叉树的数据结构来描述的,我们可以这么理解聚簇索引:索引的叶节点就是数据节点。而非聚簇索引的叶节点仍然是索引节点,只不过有一个指针指向对应的数据块。

举例:某同学如果想去图书馆找一本书,而不知道这本书在哪里?那么这个同学首先应该找的就是检索室。对于要查找一本书来说,在检索室查是一个非常快捷的的途径了。但是,在检索室中查到了该书在XX室XX书架的信息。查询并没有结束。此同学仅仅找到了目的书的位置信息,还要去该位置去取书。

 

 

对于这种方式来说,需要两个步骤: 1、查询该记录所在的位置。 2、通过该位置去取要找的记录。

四、索引与主键的区别

主键:主键是唯一的,用于快速定位一条记录。

聚集索引:聚集索引也是唯一的(因为聚集索引的划分依据是物理存储)。而聚集索引的主要是为了快速的缩小查找范围,即记录数目未定。

主键和索引没有关系。他们的用途相近。如果聚集索引加上唯一性约束之后,他们的作用就一样了。

 

五、聚集索引和非聚集索引的区别

下面的表总结了何时使用聚集索引或非聚集索引:

动作描述

使用聚集索引

使用非聚集索引

列经常被分组排序

返回某范围内的数据

不应

一个或极少不同值

不应

不应

小数目的不同值

不应

大数目的不同值

不应

频繁更新的列

不应

外键列

主键列

频繁修改索引列

不应

 

posted @ 2018-01-10 10:02  wllw6  阅读(94)  评论(0编辑  收藏  举报