SQL Server 2005 排序order by对查询性能的影响(1)
在web开发中经常碰到排序,可能有人有这样的想法:
1,排序是什么时候排序,是在执行sql语句前完成排序功能,还是最后?
2,排序对sql语句性能有影响吗?
3,在排序中建立索引有好处吗?
这段时间,在优化系统时,也碰到类似的问题,今天我们来讨论一下排序这个问题,
1,首先我们看看什么时候排序
执行以下的sql语句:
FROM
[dbo].[[[zping.com]]]]] where laststepid='402882ed0ea1c940010ea2332879007f' order by workflowid
执行计划:
这里发现,sql server中排序是在数据找出来以后在进行排序的,
如果我们在前面加上一个top 2 *限制条件,那”Sort“和“Top N ”谁先谁后啦。执行了一下,
发现,”Sort“和“Top N ”合并成了一个“Top N Sort”操作,在排序时,就直接选出数据了
顺序:
排序是“top N”前执行,查出全部数据后执行的。
2,排序对sql语句性能有影响吗?
1,上面刚刚看到,但通过索引选出来的数据比较少时,排序是很快的。对性能没有影响。uju
2, 但如果查询没有条件,如下列sql
ORDER BY workflowid DESC
如果此时workflowid没有索引,该查询速度会很慢:
为何:因为这时数据库不知道workflowid的排序顺序,只有进行表扫描,取出全部表数据,才能按workflowid来排序,再进行排序后取前几行数据。
如果这时在workflowid建立有索引,优化器就可以通过索引排序好的RID,取出990行数据,这时执行计划里就不会有"sort"操作,
因为索引已经排好序了。
但对其他sql有影响吗?这次我们在优化分页功能是就发现排序很花费时间。为何啦?,我们先看看一个常用排序sql
FROM
[dbo].[[[zping.com]]]]]
WHERE
(ID IN (SELECT TOP (10*(10000-1)) ID FROM [dbo].[[[zping.com]]]]] ORDER BY workflowid ))
ORDER BY
workflowid DESC
这里的:id为唯一索引,workflowid为非唯一索引,执行计划如下:
这里发现:排序很花时间,占到了44%的开销了。
为何我在workflowid建立了索引,还是慢啦?