索引总结篇

范围查找

在聚簇索引下,数据在物理上按顺序排在数据页上,重复值也排在一起,因而在那些包含范围检查(between、<、<=、>、>=)或使用group by或order by的查询时,一旦找到具有范围中第一个键值的行,具有后续索引值的行保证物理上毗连在一起而不必进一步搜索,避免了大范围扫描,可以大大提高查询速度。

聚积索引选择

选择聚簇索引应基于where子句和连接操作的类型

聚簇索引的侯选列是:

  1. 主键列,该列在where子句中使用或经常用它作为连接的时候。
  2. 按范围存取的列,如pri_order > 100 and pri_order < 200
  3. 在group by或order by中使用的列。(要取决于使用的索引)
  4. 不经常修改的列。因为码值修改后,数据行必须移动到新的位置,会引起磁盘I/O问题。
  5. 在连接操作中使用的列。
  6. 如果知道索引键的所有值都是唯一的,那么确保把索引定义成唯一索引。
  7. 经常同时存取多列,且每列都含有重复值可考虑建立复合索引来覆盖一个或一组查询,并把查询引用最频繁的列作为前导列,如果可能尽量使关键查询形成覆盖查询。
  8. 在一个经常做插入操作的表上建索引时,使用fillfactor(填充因子)来减少页分裂,同时提高并发度降低死锁的发生。如果在只读表上建索引,则可以把fillfactor置为100(不需要预留空间)。
  9. 在选择索引键时,设法选择那些采用小数据类型的列作为键以使每个索引页能够容纳尽可能多的索引键和指针,通过这种方式,可使一个查询必须遍历的索引页面降到最小。
  10. 尽可能地使用整数为键值,因为它能够提供比任何数据类型都快的访问速度。

索引维护

  1. 修改了某条数据后,该表的聚积索引肯定会更新一次
  2. 如果非聚集索引中包含被修改到的字段,那么该索引会更新
  3. 删除数据或新增数据,那么都会引起索引的更新操作
  4. 即使是删除或修改一条不存在的记录,也会引起索引的更新操作

非聚积索引

  1. 一个表可以有249个非聚积索引
  2. 非聚积索引会占用空间。
  3. 索引键如何选择的,扫描是否效果更好。
  4. 数据频繁更新,索引带来的开销也大。指向数据的每个非聚积索引有页级行也必须更新,有时可能还会引起分页。

非聚积索引

建立非聚簇索引要非常慎重。非聚簇索引常被用在以下情况:

  1. 某列常用于集合函数(如Sum,....)
  2. 某列常用于join,order by,group by
  3. 查寻出的数据不超过表中数据量的20%

复合索引

多个字段创建复合索引时,要将查询用得最多的字段放在复合索引的第一位。单字段查询时,只有第一位的索引列值才会用到索引。

覆盖索引

覆盖索引是指那些索引项中包含查寻所需要的全部信息的非聚簇索引,这种索引之所以比较快也正是因为索引页中包含了查寻所必须的数据,不需去访问数据页。如果非聚簇索引中包含结果数据,那么它的查询速度将快于聚簇索引。但是由于覆盖索引的索引项比较多,要占用比较大的空间。而且update操作会引起索引值改变。所以如果潜在的覆盖查询并不常用或不太关键,则覆盖索引的增加反而会降低性能。

创建 ([ItemCode])INCLUDE ( [CostPrice],[Weight])

索引空间变化:0.219 MB –> 41.797 MB

重建索引

随着数据行的插入、删除和数据页的分裂,有些索引页可能只包含几页数据,另外应用在执行大块I/O的时候,重建非聚簇索引可以降低分片,维护大块I/O的效率。重建索引实际上是重新组织B-树空间。在下面情况下需要重建索引:

  1. 数据和使用模式大幅度变化。
  2. 排序的顺序发生改变。
  3. 要进行大量插入操作或已经完成。
  4. 使用大块I/O的查询的磁盘读次数比预料的要多。
  5. 由于大量数据修改,使得数据页和索引页没有充分使用而导致空间的使用超出估算。
  6. dbcc检查出索引有问题。即碎片率过高时。
  7. 当重建聚簇索引时,这张表的所有非聚簇索引将被重建(应该是所有非聚积索引需要重建,引擎不会自动重建的).

索引统计信息

当在一个包含数据的表上创建索引的时候,SQL Server会创建分布数据页来存放有关索引的两种统计信息:分布表和密度表。优化器利用这个页来判断该索引对某个特定查询是否有用。但这个统计信息并不动态地重新计算(存疑?)。这意味着,当表的数据改变之后,统计信息有可能是过时的,从而影响优化器追求最有工作的目标。因此,在下面情况下应该运行update statistics命令:

  1. 数据行的插入和删除修改了数据的分布
  2. 对用truncate table删除数据的表上增加数据行。
  3. 修改索引列的值。
  4. 创建或重建索引是可用操作是否重新统计索引信息选项: STATISTICS_NORECOMPUTE  = OFF

不合适的索引

不恰当的索引不但于事无补,反而会降低系统的执行性能。因为大量的索引在插入、修改和删除操作时比没有索引花费更多的系统时间。例如下面情况下建立的索引是不恰当的:

1.在查询中很少或从不引用的列不会受益于索引。

2.只有两个或三个值的列,如男性和女性(是或否),从不会从索引中得到好处。

分区索引

鉴于索引加快了查询速度,但减慢了数据更新速度的特点。可通过在一个段上建表,而在另一个段上建其非聚簇索引,而这两段分别在单独的物理设备上来改善操作性能。(将数据分区,历史数据跟最近的数据分布在不同的物理磁盘,然后相应创建分区索引)

创建原则

  1. 历史库设置为只读数据库,所有索引不预留空间。
  2. 更多的索引一方面会影响数据处理效率,另一方面,过多的索引在SQL选择SQL语句的执行方案时,会导致SQL做更多的尝试来寻找合适的执行方案,导致查询效率的下降。
posted @ 2013-09-21 17:40  超缘  阅读(179)  评论(0编辑  收藏  举报