索引深入浅出(7/10):非唯一列上的非聚集索引
在索引深入浅出:非聚集索引的B树结构在聚集表里,我们讨论了非聚集索引。我们提到,唯一非聚集索引可以让所讨论的问题变得简单很多。我们已经知道了非聚集索引的通用结构,现在我们来看下在非唯一列上的非聚集索引的存储结构。
在索引深入浅出:选择正确并合适的聚集索引键里,我们讨论了在非唯一列上如何管理聚集键。我们知道SQL Server会给所有发生重复的聚集键增加4 bytes的值。同样,非聚集索引在B树的所有层增加聚集键,让在下一层的记录标识唯一。至于聚集索引,uniquifier 只在重复时增加。对于非聚集索引,如果创建索引不唯一时,聚集键会在所有记录增加。如果非聚集索引是以唯一定义的,SQL Server只在叶子层增加聚集键,用做书签查找(bookmark lookup)操作。
我们来看一个例子。
1 SELECT * INTO dbo.SalesOrderDetail FROM AdventureWorks2008r2.Sales.SalesOrderDetail 2 GO 3 CREATE UNIQUE CLUSTERED INDEX ix_SalesOrderDetail ON dbo.SalesOrderDetail(SalesOrderDetailID) 4 GO 5 CREATE INDEX Ix_ProductId ON SalesOrderDetail(ProductId,Salesorderid)
我们创建了SalesOrderDetail表的副本,在SalesOrderDetailId 列定义了唯一聚集索引,在ProductId和SalesOrderId列定义了非聚集索引。注意,在创建非聚集索引的时候,我有意回避了使用Unique关键字,即使这个非聚集索引键是唯一的。
我们用DBCC IND看下非聚集索引的页面分配情况,并找出根页。
1 TRUNCATE TABLE dbo.sp_table_pages 2 INSERT INTO sp_table_pages EXEC('DBCC IND(IndexDB,SalesOrderDetail,2)') 3 GO 4 5 SELECT * FROM dbo.sp_table_pages ORDER BY IndexLevel DESC --根节点/索引页
可以看出,5128页是我们的根页。我们用DBCC PAGE看下5128页信息还有叶子页的信息。
1 DBCC TRACEON(3604) 2 DBCC PAGE(IndexDB,1,5128,3)--根页 3 4 DBCC TRACEON(3604) 5 DBCC PAGE(IndexDB,1,3760,3)--叶子页
我们来看上半部分的根页,聚集键(SalesOrderDetailid)被加到了根页。如果你和索引深入浅出:非聚集索引的B树结构在聚集表里的根页比较,会发现那里的根页里没有聚集键,只有在叶子页里才可以找到聚集键。在你把非聚集索引定义为唯一或非唯一(unique or non unique)时,叶子层的页结构不会发生改变。
我们看下堆表的情况。
1 SELECT * INTO dbo.SalesOrderDetailHeap FROM AdventureWorks2008R2.Sales.SalesOrderDetail 2 GO 3 CREATE INDEX Ix_ProductId ON SalesOrderDetailHeap (ProductId,Salesorderid) 4 GO 5 SELECT index_id FROM sys.indexes WHERE name='Ix_ProductId' AND 6 OBJECT_NAME(OBJECT_ID)='SalesOrderDetailHeap' 7 GO 8 DBCC ind('IndexDB','SalesOrderDetailHeap',2) 9 GO 10 TRUNCATE TABLE dbo.sp_table_pages 11 INSERT INTO sp_table_pages EXEC('DBCC IND(IndexDB,SalesOrderDetailHeap,2)') 12 SELECT * FROM dbo.sp_table_pages ORDER BY IndexLevel DESC --根节点/索引页 13 DBCC TRACEON(3604) 14 DBCC PAGE(IndexDB,1,1192,3)--根页 15 16 DBCC TRACEON(3604) 17 DBCC PAGE(IndexDB,1,1096,3)--叶子页
在根页我们看到多了Heap RID列,如果你回去看看索引深入浅出:非聚集索引的B树结构在堆表,你会发现Heap RID列只在叶子层里的页出现,不在根页出现。在你把非聚集索引定义为唯一或非唯一(unique or non unique)时,叶子层的页结构不会发生改变。
你可能已经注意到,在我们上述的例子里,即使非聚集索引键是唯一的,SQL Server还是只当它是非聚集索引,因为当我们创建非聚集索引时没加unique关键字。在索引所有层增加聚集键(或Heap RID)可能会增加更多的索引层IO操作,这个看聚集键的大小而定。因此在所有情况下,我们定义非聚集索引时,考虑选择唯一列(或多列)作为非聚集键非常重要。
参考文章:
注:此文章为WoodyTu学习MS SQL技术,收集整理相关文档撰写,欢迎转载,请在文章页面明显位置给出此文链接!
若您觉得这篇文章还不错请点击下右下角的推荐,有了您的支持才能激发作者更大的写作热情,非常感谢!