MSSQL调优实战一乱建聚集索引的后果

今天调优某电信的大型数据库，是一个日志型的表，其中有个自增列字段和时间（时间是每个小时小时来的，每个小时有大概23万条记录），以及点击次数等日志信息，数据量在4000万以上，sp_spaceused使用了大概2G多的磁盘空间。整个表没有分区。整个表都是插入查询，没有更新操作。
有一个基于时间字段上的时间段where范围选择，然后聚合找到某些类型的聚合值。
观察发现自增列字段就是一个摆设，没有任何作用，也不做任何表的外键，只是可能当时开发人员在设计表的时候就不管3721都来一个自增列主键，导致在对date字段上的非聚集索引扫描后，还需要去聚集索引树上seek一下，这下子就增加一个嵌套查询了。去掉表上的主键聚集索引，将表回归为堆，这样在非聚集索引扫描后直接就拿到RID找相应行了。
后来又想办法整了个date字段上的include索引，将要汇总的字段都加到非聚集索引上来，连RID查找都不要了。include虽然增加磁盘开销，但是速度上去很多，且没有针对索引的更新，不涉及索引拆分等费时操作，所以觉得还是值得。
最后优化结果，由45秒到20秒。
优化结果还比较满意，最后最重要的是因为IO始终将不下来，因为数据太多了。
不知道还有没有办法能想想的。
其实以前自己在设计数据库的时候也经常对表开始就来一个主键，而并没有考虑其实际意义，导致表的操作非常困难。
这个日志类型的表基本不需要自增主键字段，他不会根据某一日志ＩＤ范围来查找或者更新日志。

但在优化的时候有个问题觉得很奇怪：
４０００万的数据，查找其中的２万条，根据日期上的过滤，我想应该是一个嵌套的书签查询计划，结果看到ＭＳＳＱＬ给出的答案却是聚集索引扫描。４０００万比２万的数据，却宁愿表扫描而不愿意做嵌套？只有指定了使用非聚集索引后查询计划才改成嵌套的书签查询。
问问大家这个是为何呢？难道聚集索引扫描的ＩＯ更低？

posted on 2008-02-26 23:45 Keep Walking 阅读(11690) 评论(11) 编辑收藏举报

MSSQL调优实战一乱建聚集索引的后果

搜索

常用链接

积分与排名

随笔分类

随笔档案

Data Base

often used

阅读排行榜

评论排行榜

推荐排行榜

最新评论

MSSQL调优实战一 乱建聚集索引的后果

搜索

常用链接

积分与排名

随笔分类

随笔档案

Data Base

often used

阅读排行榜

评论排行榜

推荐排行榜

最新评论

MSSQL调优实战一乱建聚集索引的后果