常用的数据分页技术总结

        根据2个博文的总结

        常用的数据分页技术总结:http://www.cnblogs.com/refactor/archive/2012/06/28/2552700.html

        网上搜集的几种数据分页的总结 http://www.cnblogs.com/kingboy2008/archive/2011/06/22/2086710.html

                                            http://www.cnblogs.com/builderman/archive/2011/07/19/2110108.html

1.数据分页概述   

• 通常在Web页面中,在数据量比较大时,无法在一个页面中显示所有数据   

• 在某些特定场景下,并不需要返回所有满足条件的数据   

• 从数据的角度看,需要返回指定范围内的数据

2.数据层分页技术   

• 在数据库查询时,只查询特定页面的数据   

• 主要由T -SQL来完成   

• 适用于比较大的数据表   

• 优点:返回的结果集小,查询速度快   

• 缺点:需要多次查询数据库

3.数据层分页技术-使用临时表

• 在查询数据前,创建一个临时表   

• 表的列比要返回的结果集多一个标识列   

• 按照特定列排序,将结果插入到临时表中   

• 此时,可以按照标识列返回特定页面

View Code
CREATE PROCEDURE paging2
 
 @pageNum INT
 
,@Num INT
 
AS
 
BEGIN
 
SELECT  AddressLine1,AddressLine2,City,PostalCode,IDENTITY(int) Num INTO #temp 
FROM Person.Address ORDER BY AddressID ASC 

SELECT * FROM #temp WHERE  Num<=@Num*@pageNum AND Num> @Num*(@pageNum-1)
 
ORDER BY Num ASC
 
DROP TABLE #temp
 
END
EXEC paging2 20,5;--每页五条,第二十页数据 耗时: 1s
 
EXEC paging0 20000,5;--每页五条,第二万页数据 耗时: 1s
 
EXEC paging0 200000,5;--每页五条,第二十万页数据 耗时: 1s

 

4.数据层分页技术-使用表变量   

• 在查询数据前,创建一个表变量   

• 表的列比要返回的结果集多一个标识列   

• 按照特定列排序,将结果插入到表变量中   

• 此时,可以按照标识列返回特定页面

5.数据层分页技术-反复取Top     

• 若要按特定列正排序取第91-100 行数据   

• 首先,按特定列正排序取Top 100   

• 然后,反向排序取Top 10   

• 最后,再将结果正排序后返回

create PROCEDURE fenye
 (
 @pageNum INT 
 
 ,@Num INT    
 )
AS
 
BEGIN
 
SELECT * from (SELECT TOP (@Num) *  FROM 
(SELECT TOP (@Num*@pageNum) * FROM Person.Address ORDER BY AddressID asc) b ORDER BY b.AddressID desc
 )c ORDER BY c.AddressID asc
END 

这个中方法先把数据库中的前@Num*@pageNum条数据取出,再从结果集中取出最后的@Num条数据,当然两个排序规则是不一样的这点很重要,不然起不到分页效果。 你可以具体试一下就明白了。缺点在于获取的页数越多就越慢
 
看性能
EXEC paging1 2,5;--每页五条,第十页数据 耗时:1s
 
EXEC paging1 200,5;--每页五条,第200页数据 耗时:1s
 
EXEC paging1 20000,5;--每页五条,第20000页数据 耗时:1s
 
EXEC paging1 200000,5;--每页五条,第二十万页数据 耗时: 3s

  

  

6.数据层分页技术-使用行号   

• 在SQL Server 2005/2008中   

• 查询结果集时,添加一个ROW NUMBER() 表示行号  (不懂ROW NUMBER():详见:http://www.cnblogs.com/fxgachiever/archive/2010/09/15/1826792.html) 

• 将上述结果集作为子查询,通过ROW_NUMBER() 筛选出特定页面

View Code
 之所以要改进第三种方式那是因为,Top关键字其实是
 
已经经过性能优化了的之所以比不过ROW_NUMBER()的执行效率是因为用了两次,那么既然如此,我们何不将二者结合起来使用,效果岂不更佳。那就让我们改进一下吧。
 
 
 
CREATE PROCEDURE paging0 

@pageNum INT
 
,@Num INT
 
AS 

begin
 
SELECT * FROM 

(
 
SELECT TOP (@Num*@pageNum)  measurePipe,measureTime,measureCycle,MeasureData,
 
          doseRateValue,ROW_NUMBER() OVER(ORDER BY GMpipe.measureTime ASC ) AS NUM 

FROM GMpipe)A
 
WHERE A.NUM> @Num*(@pageNum-1) ORDER BY A.measureTime desc
 
END
 
Go
 
看性能
EXEC paging0 20,5;--每页五条,第二十页数据 耗时: 1s
 
EXEC paging0 20000,5;--每页五条,第二万页数据 耗时: 1s
 
EXEC paging0 200000,5;--每页五条,第二十万页数据 耗时: 1s

 

7.代码如下:

View Code 

USE AdventureWorks2008
GO
SELECT COUNT(*) FROM Production.TransactionHistoryArchive
GO
SELECT TOP 50 * FROM Production.TransactionHistoryArchive
ORDER BY ReferenceOrderID ASC
GO

--Use Top*Top
DECLARE @Start datetime,@end datetime;
SET @Start=getdate();

DECLARE @PageNumber INT, @Count INT, @Sql varchar(max);
SET @PageNumber=5000;
SET @Count=10;
SET @Sql='SELECT T2.* FROM (
    SELECT TOP 10 T1.* FROM 
        (SELECT TOP ' + STR(@PageNumber*@Count) +' * FROM Production.TransactionHistoryArchive
        ORDER BY ReferenceOrderID ASC) AS T1
    ORDER BY ReferenceOrderID DESC) AS T2
ORDER BY ReferenceOrderID ASC';
EXEC (@sql);

SET @end=getdate();
PRINT Datediff(millisecond,@Start,@end);
GO

--USE table value
DECLARE @Start datetime,@end datetime;
SET @Start=getdate();
DECLARE @PageNumber INT, @Count INT, @Sql varchar(max);
SET @PageNumber=5000;
SET @Count=10;

DECLARE @local_variable table (RowNumber int identity(1,1),[TransactionID] [int],
    [ProductID] [int],
    [ReferenceOrderID] [int],
    [ReferenceOrderLineID] [int],
    [TransactionDate] [datetime],
    [TransactionType] [nchar](1),
    [Quantity] [int],
    [ActualCost] [money],
    [ModifiedDate] [datetime]);
insert into @local_variable (TransactionID, ProductID, ReferenceOrderID, ReferenceOrderLineID, TransactionDate, TransactionType, Quantity, ActualCost, ModifiedDate) 
SELECT TOP 50000 TransactionID, ProductID, ReferenceOrderID, ReferenceOrderLineID, TransactionDate, TransactionType, Quantity, ActualCost, ModifiedDate from Production.TransactionHistoryArchive ORDER BY ReferenceOrderID ASC
select * from @local_variable where RowNumber > (@PageNumber-1)*@Count and RowNumber <= @PageNumber*@Count

SET @end=getdate();
PRINT Datediff(millisecond,@Start,@end);
GO

--USE temp table
DECLARE @Start datetime,@end datetime;
SET @Start=getdate();
DECLARE @PageNumber INT, @Count INT, @Sql varchar(max);
SET @PageNumber=5000;
SET @Count=10;

create table #local_variable(RowNumber int identity(1,1),[TransactionID] [int],
    [ProductID] [int],
    [ReferenceOrderID] [int],
    [ReferenceOrderLineID] [int],
    [TransactionDate] [datetime],
    [TransactionType] [nchar](1),
    [Quantity] [int],
    [ActualCost] [money],
    [ModifiedDate] [datetime]);
insert into #local_variable (TransactionID, ProductID, ReferenceOrderID, ReferenceOrderLineID, TransactionDate, TransactionType, Quantity, ActualCost, ModifiedDate) 
SELECT TOP 50000 TransactionID, ProductID, ReferenceOrderID, ReferenceOrderLineID, TransactionDate, TransactionType, Quantity, ActualCost, ModifiedDate from Production.TransactionHistoryArchive ORDER BY ReferenceOrderID ASC
select * from #local_variable where RowNumber > (@PageNumber-1)*@Count and RowNumber <= @PageNumber*@Count

SET @end=getdate();
PRINT Datediff(millisecond,@Start,@end);
GO

--Use ROW_NUMBER
DECLARE @Start datetime,@end datetime;
SET @Start=getdate();

DECLARE @PageNumber INT, @Count INT, @Sql varchar(max);
SET @PageNumber=5000;
SET @Count=10;
SELECT * FROM 
(    SELECT ROW_NUMBER()  
      OVER(ORDER BY ReferenceOrderID) AS RowNumber,    
      *
    FROM Production.TransactionHistoryArchive) AS T
WHERE T.RowNumber<=@PageNumber*@Count AND T.RowNumber>(@PageNumber-1)*@Count;

SET @end=getdate();
PRINT Datediff(millisecond,@Start,@end);
GO

  

8.应用层分页技术(自定义分页方法)   

• 在应用层/逻辑层缓存数据,并进行数据的分段显示   

• 主要由程序代码完成   

• 优点:查询数据库次数少,每次返回结果快   

• 缺点:第一次查询慢,占用应用层内存资源

9.应用层分页技术-GridView   

• 应用GridView的分页功能   

• 启用XxxDataSource 控件的缓存功能

10.应用层分页技术-DataPager   

• .NET 3.5 当中的新控件   

• 更加灵活定义分页格式

11.应用层分页技术-PagedDataSource 对象分页   

• .NET  当中的对象   

• 更加灵活定义分页格式,但是代码量特多,不好控制

12.应用层分页技术-LINQ   

• 自定义数据绑定   

• 使用LINQ 进行查询   

• 使用Skip() 和Take() 函数

12.展现层分页技术 (JS,jquery组合成的第三方View控件) 

• 在客户端进行数据分页   

• 主要通过客户端脚本来实现   

• 优点:减少网络传输量,提高带宽利用率   

• 缺点:需要编写大量客户端脚本,增加开发与维护成本

13.展现层分页技术-UpdatePanel   

• 通过ASP.NET AJAX 中的UpdatePanel 控件,可以将应用层所提供的分页功能转换到客户端   

• 无需维护代码   

• 充分利用服务器端控件功能

14.展现层分页技术-Data Services   

• 使用Data Services所提供的基于URI 的数据访问,可以实现数据分页   

• 在展现层,可以直接通过Javascript 进行解析   

• 轻量级数据传输格式:XML/JSON

总结

我们再来改变一下每页的条数看看

临时表方式:

EXEC paging2 5000,200;--每页两百条,第五千页数据 耗时:7s

Top语句方式:

EXEC paging1 5000,200;-- 每页两百条,第五千页数据 耗时: 3s

ROW_NUMBER()函数方式:

EXEC paging0 5000,200;--每页五条,第二十万页数据 耗时:1s

 

 

 

另外的SQL分页

SQL Server 存储过程的分页,这个问题已经讨论过几年了,很多朋友在问我,所以在此发表一下我的观点 建立表:

CREATE TABLE [TestTable] ( [ID] [int] IDENTITY (1, 1) NOT NULL , [FirstName] [nvarchar] (100) COLLATE Chinese_PRC_CI_AS NULL , [LastName] [nvarchar] (100) COLLATE Chinese_PRC_CI_AS NULL , [Country] [nvarchar] (50) COLLATE Chinese_PRC_CI_AS NULL , [Note] [nvarchar] (2000) COLLATE Chinese_PRC_CI_AS NULL ) ON [PRIMARY] GO

 

插入数据:(2万条,用更多的数据测试会明显一些) SET IDENTITY_INSERT TestTable ON

declare @i int set @i=1 while @i<=20000 begin     insert into TestTable([id], FirstName, LastName, Country,Note) values(@i, 'FirstName_XXX','LastName_XXX','Country_XXX','Note_XXX')     set @i=@i+1 end

SET IDENTITY_INSERT TestTable OFF

 

-------------------------------------

分页方案一:(利用Not In和SELECT TOP分页) 语句形式:

SELECT TOP 10 * FROM TestTable WHERE (ID NOT IN          

(SELECT TOP 20 id          FROM TestTable          ORDER BY id)) ORDER BY ID

格式形式:

SELECT TOP 页大小 * FROM TestTable WHERE (ID NOT IN  

(SELECT TOP 页大小*页数 id-1          FROM 表          ORDER BY id)) ORDER BY ID

-------------------------------------

分页方案二:(利用ID大于多少和SELECT TOP分页) 语句形式:

SELECT TOP 10 * FROM TestTable WHERE (ID >          

(SELECT MAX(id)          FROM (SELECT TOP 20 id                  FROM TestTable                  ORDER BY id) AS T)) ORDER BY ID

格式形式:

SELECT TOP 页大小 * FROM TestTable WHERE (ID >           (SELECT MAX(id)         

FROM (SELECT TOP 页大小*页数 id-1                  FROM 表                  ORDER BY id) AS T)) ORDER BY ID

-------------------------------------

分页方案三:(利用SQL的游标存储过程分页)

create  procedure XiaoZhengGe @sqlstr nvarchar(4000), --查询字符串

@currentpage int, --第N页

@pagesize int --每页行数

as

set nocount on

declare @P1 int, --P1是游标的id

@rowcount int exec sp_cursoropen

@P1 output,@sqlstr,@scrollopt=1,

@ccopt=1,@rowcount=@rowcount output select ceiling(1.0*@rowcount/@pagesize) as 总页数--,@rowcount as 总行数,@currentpage as 当前页 set @currentpage=(@currentpage-1)*@pagesize+1 exec sp_cursorfetch @P1,16,@currentpage,@pagesize exec sp_cursorclose @P1 set nocount off

其它的方案:

如果没有主键,可以用临时表,也可以用方案三做,但是效率会低。 建议优化的时候,加上主键和索引,查询效率会提高。

通过SQL 查询分析器,显示比较:

我的结论是:

分页方案二:(利用ID大于多少和SELECT TOP分页)效率最高,需要拼接SQL语句

分页方案一:(利用Not In和SELECT TOP分页)   效率次之,需要拼接SQL语句

分页方案三:(利用SQL的游标存储过程分页)    效率最差,但是最为通用

在实际情况中,要具体分析。

 

posted @ 2012-06-29 19:11  黎明&岁月  阅读(1422)  评论(1编辑  收藏  举报