SQL Server中几种遍历方式比较

SQL遍历解析

  在SQL的存储过程,函数中,经常需要使用遍历(遍历table),其中游标、临时表等遍历方法很常用。面对小数据量,这几种遍历方法均可行,但是面临大数据量时,就需要择优选择,不同的遍历方法,在效率上存在指数级别的差异

本文列举了常用的3中遍历方法:游标、临时表、索引表,重点分析其效率。

  本文主要针对大量数据的遍历,当数据量小时;可以随意选择一种遍历方法。

  实例数据如下:一共177471条数据

  需求:更新LDBM,其中LDBM=LXBM+LDXLH;即update V_TL_T_LD_ALL set LDBM=LXBM+LDXLH:为了演示遍历,我们循环遍历,一条条数据更新,同时统计其效率,并初略分析其原因

1.游标遍历

游标的遍历

游标是一种最常用的方法,使用起来比较简单,主要步骤为:声明游标,打开游标,使用游标,关闭游标和释放游标。示例代码如下

 1 -- 方法1:游标
 2 -- 声明变量
 3 DECLARE
 4     @LDBM AS NVARCHAR(20),
 5     @LDXLH AS NVARCHAR(20),
 6     @LXBM AS NVARCHAR(20),
 7     @CROWID AS NVARCHAR(80);
 8     
 9 -- 声明游标
10 DECLARE T_LD CURSOR FAST_FORWARD FOR
11     SELECT LDBM,LDXLH,LXBM,CROWID
12     FROM V_TL_LD_ALL1
13     
14 OPEN T_LD;
15 
16 -- 取第一条记录
17 FETCH NEXT FROM T_LD INTO @LDBM,@LDXLH,@LXBM,@CROWID;
18 
19 WHILE @@FETCH_STATUS=0
20 BEGIN
21     -- 操作
22     UPDATE V_TL_LD_ALL1 SET LDBM= @LDBM+' '+@LDXLH WHERE CROWID=@CROWID;
23     
24     -- 取下一条记录
25     FETCH NEXT FROM T_LD INTO @LDBM,@LDXLH,@LXBM,@CROWID;
26 END
27 
28 -- 关闭游标
29 CLOSE T_LD;
30 
31 -- 释放游标
32 DEALLOCATE T_LD;

游标是最直接的从表里面一条条的数据取出,并进行update操作,没有涉及到索引,如果数据量大,其取数据和update都将消耗大量的时间,因此此种方式效率很低。

从对数据库的操作上,其一共操作数据库2n+1次,将数据取出并存入游标(申明游标):1次;update更新操作:n次;从游标取记录:n次;将数据存储到游标和消耗了大量的内存,且随着数据量的增大,消耗值将呈现指数增加

更新上述177474条数据一共消耗了2h48min37s

2.临时表

使用游标不仅仅存在性能的问题,也违背面向集合思想的问题,所以我们有必要用面向集合的思想去找到一种更好的解决方案,即使用面向对象的思想,构造一个临时表,然后直接操作临时表,代码如下。

 1 -- 方法2:使用临时表
 2 -- 创建临时表
 3 SELECT LDBM,LDXLH,LXBM,CROWID
 4 INTO #T_LD
 5 FROM V_TL_LD_ALL1
 6 
 7 -- 声明变量
 8 DECLARE
 9       @LDBM AS NVARCHAR(20),
10       @LDXLH AS NVARCHAR(20),
11       @LXBM AS NVARCHAR(20),
12       @CROWID AS NVARCHAR(80);
13     
14 WHILE EXISTS(SELECT CROWID FROM #T_LD)
15 BEGIN
16     -- 也可以使用top 1
17     SET ROWCOUNT 1
18     SELECT @LXBM= LXBM, @LDXLH= LDXLH,@CROWID=CROWID FROM #T_LD;
19     UPDATE V_TL_LD_ALL1 SET LDBM= @LXBM+' '+@LDXLH WHERE CROWID=@CROWID;
20     SET ROWCOUNT 0
21     
22     DELETE FROM #T_LD WHERE CROWID=@CROWID;
23 END

 使用临时表,和游标类似,同时将大量的数据存储到内存中,但是随着遍历的进行,临时表的数据量越来越小,可以相当程度的降低内存的消耗,但是需要不停的与table表做交互,一共操作3n+1次数据库;

此种方式,更新上述数据一共消耗:1H:45min:37S

3.索引表

索引表和临时表的操作类似;唯一区别在于在建立临时表是,添加一个索引,然后通过此索引从表中取数据;效率上有所提升,但是增加了变量的输出,代码如下

 1 --方法3:使用索引表
 2 --创建临时表
 3 IF EXISTS(Select Name From Sysobjects Where Name='tmpTable')  
 4 DROP table tmpTable     --存在则删除  
 5 create table tmpTable(
 6     NID int primary key identity(1,1),               --主键,自增
 7     CrowId nvarchar(90), 
 8     LXBM nvarchar(20),
 9     LDXLH nvarchar(6),                        
10 )  
11 --插入数据
12 insert into tmpTable(CrowId,LXBM,LDXLH)
13 select CrowId,LXBM,LDXLH from V_TL_LD_ALL1
14 
15 -- 声明变量
16 DECLARE
17 @index int,
18 @countNum int,
19 @LDBM AS NVARCHAR(20),
20 @LDXLH AS NVARCHAR(20),
21 @LXBM AS NVARCHAR(20),
22 @CROWID AS NVARCHAR(80);
23 
24 select @countNum=count(1) from  tmpTable;
25 set @index=0;
26 --遍历
27 while @index<@countNum
28     begin
29         set @index=@index+1;
30         select @LXBM= LXBM, @LDXLH= LDXLH,@CROWID=CROWID from tmpTable where NID=@index
31         UPDATE V_TL_LD_ALL1 SET LDBM= @LXBM+' '+@LDXLH WHERE CROWID=@CROWID;
32     end
33 
34 --删除临时索引表
35 DROP table tmpTable  

临时索引表和临时表类似,区别在于:在取数据的时候,通过索引的方式取数据;相比临时表,减少了频繁操作数据库的次数,相比游标,减少了与数据库交互的时间(索引检索速度更快)

更新上述数据,一共消耗:1H2,min

 

比较而言,建议尽可能少的使用游标,不仅消耗内存,代码量也稍微复杂一些;当数据量小的时候,建议使用临时表(代码比较轻量),而随着数据的增加,建议使用索引表

posted @ 2018-05-04 15:14  光头才能强  阅读(1843)  评论(0编辑  收藏  举报