Clustered index和non-clustered index的小小总结

Clustered index和non-clustered index本质上都是B-tree数据结构,它们的区别仅仅体现在叶子节点上。

  • 在Clustered index中,索引数据和表数据共同保存在叶子节点中,
  • 在Non-clustered index中,叶子节点保存索引数据以及该索引所指向的数据记录的指针。

所以在Non-clustered index中,需要额外的一步才能读到真正的数据。

我们来看看下面的例子,数据表employee包含下列字段:

Id, name, col1, col2, col3, col4, OnboardDate

如果我们在Id上创建主键,系统会自动创建clustered index。以下查询:

select * from employee where id = 123

可以直接在该clustered index中完成所有的读取,不需要额外的跳转。

显然每个表只能有一个clustered index。

为了适应其它的查询,我们需要创建额外的索引,此时只能以non-clustered index的形式创建。比如如果我们需要查询指定时间入职的员工:

Select id from employee where onboarddate = $date1

那么

  1. 可以在onboarddate上创建non-clustered index, 查询时sql server需要根据引用找到最终数据存放的页面。
  2. 也可以创建包含id和onboarddate在内的复合索引,这样sql server可以在该索引内部找到所有的数据,不需要跳转到数据页面。 

再考虑以下的查询:

Select * from employee where onboarddate = $date1


我们可以创建包含所有字段在内的索引,但是代价太大,更优美的做法是,依然创建id和onboardate在内的composite index, sql server会在索引内找到id, 然后回到clustered index里根据id找到数据记录,依然不需要跳转到page. 

如果是查询日期范围呢?比如以下的sql:

Select * from employee where onboarddate between ($date1, $date2)

此时最有效的索引是在onboarddates上创建clustered index, 这样因为数据是连续存储的,因此sqll server只需要连续读取数据即可,效率又大大的提高。 

posted @   hwangpy  阅读(329)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
点击右上角即可分享
微信分享提示