聚集索引与非聚集索引【转】

数据库是由一个或多个文件组组成，而文件组是由一个或多个文件组成，而文件是由一个或者多个区组成，每个区的大小为64k，而区又由八个物理上连续的页组成，每个页为8k。而页则是SQL Server数据库中的数据存储的基本单位。
页中保存的数据类型有：表数据、索引数据、溢出数据、分配映射、页空闲空间、索引分配等，具体如下图所示：

索引是数据库中的一个独特的结构，由于它保存数据库信息，那么我们就需要给它分配磁盘空间和维护索引表。创建索引并不会改变表中的数据，它只是创建了一个新的数据结构指向数据表；打个比方，平时我们使用字典查字时，首先我们要知道查询单词起始字母，然后翻到目录页，接着查找单词具体在哪一页，这时我们目录就是索引表，而目录项就是索引了。
当然，索引比字典目录更为复杂，因为数据库必须处理插入，删除和更新等操作，这些操作将导致索引发生变化。

索引的类型
我们知道索引的类型有两种：聚集索引和非聚集索引。
聚集索引：物理存储按照索引排序。
非聚集索引：物理存储不按照索引排序。

聚集索引
聚集索引的数据页是物理有序地存储，数据页是聚集索引的叶节点，数据页之间通过双向链表的形式连接起来，而且实际的数据都存储在数据页中。当我们给表添加索引后，表中的数据将根据索引进行排序。
假设我们有一个表T_Pet，它包含四个字段分别是：animal，name，sex和age，而且使用animal作为索引列，具体SQL代码如下：
--Create T_Pet table in tempdb.
USE tempdb
CREATE TABLE T_Pet
(
    animal    VARCHAR(20),
    [name]    VARCHAR(20),
    sex        CHAR(1),
    age        INT
)
CREATE UNIQUE CLUSTERED INDEX T_PetonAnimal1_ClterIdx ON T_Pet (animal)
--Insert 100W data into data table.
DECLARE @i int
SET @i=0
WHILE(@i<1000000)
BEGIN
    INSERT INTO T_Pet (
        animal,
        [name],
        sex,
        age
    )
    SELECT [dbo].random_string(11) animal,
            [dbo].random_string(11) [name],
            'F'                        sex,
            cast(floor(rand()*5) as int) age
    SET @i=@i+1
END
INSERT INTO T_Pet VALUES('Aardark', 'Hello', 'F', 1)
INSERT INTO T_Pet VALUES('Cat', 'Kitty', 'F', 2)
INSERT INTO T_Pet VALUES('Horse', 'Ma', 'F', 1)
INSERT INTO T_Pet VALUES('Turtles', 'SiSi', 'F', 4)
INSERT INTO T_Pet VALUES('Dog', 'Tomma', 'F', 2)
INSERT INTO T_Pet VALUES('Donkey', 'YoYo', 'F', 3)
更多内容见：http://www.cnblogs.com/rush/archive/2012/04/22/2465683.html

非聚集索引
非聚集索引是物理存储不按照索引排序，非聚集索引的叶节点（Index leaf pages）包含着指向具体数据行的指针或聚集索引，数据页之间没有连接，是相对独立的页。
假设我们有一个表T_Pet，它包含四个字段分别是：animal，name，sex和age，而且使用animal作为非索引列，具体SQL代码如下：
--Create T_Pet table in tempdb with NONCLUSTERED INDEX.
USE tempdb
CREATE TABLE T_Pet
(
    animal    VARCHAR(20),
    [name]    VARCHAR(20),
    sex        CHAR(1),
    age        INT
)
CREATE UNIQUE NONCLUSTERED INDEX T_PetonAnimal1_NonClterIdx ON T_Pet (animal)
接着我们要查询表中animal = ‘Cat’的宠物信息，具体的SQL代码如下：
SET STATISTICS PROFILE ON
SET STATISTICS TIME ON
SELECT animal, [name], sex, age
FROM T_Pet
WHERE animal = 'Cat'
SET STATISTICS PROFILE OFF
SET STATISTICS TIME OFF
我们发现查询计划的最右边有两个步骤：RID和索引查找。由于这两种查找方式相对于聚集索引查找要慢（Clustered Index Seek）。
首先SQL Server查找索引值，然后根据RID查找数据行，直到找到符合查询条件的结果。

索引的有效性
SQL Server每执行一个查询，首先要检查该查询是否存在执行计划，如果没有，则要生成一个执行计划，那么什么是执行计划呢？简单来说，它能帮助SQL Server制定一个最优的查询计划。
更多内容见：http://www.cnblogs.com/rush/archive/2012/04/22/2465683.html

posted @ 2018-10-08 15:08 skybirdzw 阅读(176) 评论(0) 收藏举报

刷新页面返回顶部

skybirdzw

别人对待你的方式是你教给他的。

聚集索引与非聚集索引【转】

公告