SQL2005合理的索引设计
合理的索引有助于提升系统性能和可用程度,我工作中见过一个设计错误的索引导致sqlserver将一台4cpu的服务器资源用尽。 权威参考参见msdn
http://msdn.microsoft.com/zh-cn/library/ms191195.aspx
我这里结合自己的经验总结下面数条,供大家参考
1、评估索引本身的占用空间,当索引相对于其数据本身过大可能会无明显作用。这种情况体现在:表很小,索引列过多,索引碎片过多。当索引在select中不起作用时,你还必须在insert和update、delete这些操作中去维护这些不起作用的数据。
2、In语句不一定不能使用索引,where id in(1,2)和where id =1 or id=2是等效的,这里的in和not in的性能是相同的。而不能使用索引的原因是嵌套查询: where id in(select 1 union select 2).
3、解除嵌套查询无法利用索引的办法是用exists子查询,select * from tb1 a where exists(select 1 from tb2 where id=a.id)。而exists和not exists的性能和tb1的数据量无关,他们的性能差别在于tb2中的数据量。
4、Like子句可以利用索引,所以尽可能少用left,right和substring函数。
5、函数不能使用索引,比如convert(varchar(7),date,120)='2008-06',或者datediff函数、甚至和常量的加减乘除运算等,正确的做法是用比较符号或者尽可能把datediff之类的函数放到等号右边。
6、不用担心隐式转换,它总是转换等号右边的。比如 where id='2' 和where id=2是等效的。[勘误:此条结论错误!转换发生在左边导致索引失效]
7、聚集索引的查询性能好于非聚集索引,但是维护代价很大,对于他的数据改变会引起整行数据的物理位置移动。同时聚集索引还要为非聚集索引提供索引服务,所以尽量不用过大的列或过多的列作聚集索引。
8、聚集索引可以极大优化大于,小于,group by和order by以及join语句的查询性能。
9、一张表只能由一个聚集索引。
10、唯一索引有助于查询优化。
11、联合索引的第一列可以单独使用,其他的索引列在单独的where子句中不起作用。
12、索引的升序降序对order by子句的影响很大。
13、符合特定条件的计算列也可以创建索引。