前言
最近在做一个DB2的项目,遇到分页处理的设计时开始犯难。以前一直采用MySQL作为项目数据库,其中的Limit关键字非常人性化,MySQL把分页的处理逻辑封装到了数据库的核心中,使得做查询设计时,根本不用过多的考虑分页的问题。
可是DB2却把这个难题推到了我们面前。其实不止DB2如此,很多大型的数据库例如MS SQL Server也不支持分页关键字。当然,DB2中提供了RowNumber函数,同Oracle有一些类似。有很多解决方案都是由此关键字得来的。
为了解决这个问题,互联网上提供了如下几个解决方案:
方案一:利用JDBC2的数据集。JDBC2数据集中提供了absolute方法,用来在查询的结果集中进行定位,数据集保存在内存中,你必须告诉JDBC你想定位的绝对位置,这个位置由你来计算。对于海量的数据集,这种方式效率并不高。
方案二:利用DB2自带的函数 ROWNUMBER() OVER(ORDER BY sort-key),这里的RowNumber函数是通过排序计算出来的行的顺序号。根据这个原理,可以先SELECT满足WHERE条件的所有记录,然后用ORDER BY排序,在行号的基础上,结合子查询的组合得出查询结果。例如:
select * from ( select rownumber() over(order by foo.bar, foo.baz) as rownumber_, * from foos foo order by foo.bar, foo.baz ) as temp_ where rownumber_ between ?+1 and ?
第三种方案的实现原理其实很简单。先用一个子查询从数据库中选出(Page-1)*PageSize个记录来,然后用max/min关键字(更加排序的方式)取出子查询中的最大或最小值。外查询再取出所有满足大于/小于这个值的前PageSize个记录。就这么简洁。
早一些的实现使用了NOT IN/NOT EXIST等关键字,后来被MAX/MIN方案所取缔,主要是考虑到效率问题。实现者表现出了对于数据库的精湛技术的同时,也为我们提供了一个优雅的解决方案。
方案比较:
三种方案各有所长。
第一种方案可以算得上是一种独立的解决方案,不需要任何特殊的数据库技术支持,只要使用JDBC2.0就可以。但在处理大规模的数据查询时,需要耗费大量的数据库游标移动所带来的性能损耗。
第二种方案是DB2和Oracle采用的解决方案,相比前一种,性能上要好很多。但同第一种相类似,仍然要把所有满足条件的记录放到内存中,通过内部的游标查询来实现分页。在特定于数据库的方案中,这种方案是一种可取的方案。另外,在对分组查询(Group BY)进行分组时,如果采用第三种方案,每一次分页都将会进行两次分组查询,非常的低效,这个时候,采用第一、二中方案就比较理想。
第三种方案是我比较欣赏的风格:优雅。之所以这么说,是因为该方案封装在存储过程中,利用了存储过程编译后运行的高效性;同时方案本身采用了优雅的通用数据库技术,通用性和效率都能得到保证。
具体采用什么样的方案,一般应该根据自己的项目实际情况来定。如果数据量比较小,建议采用第一种方案;如果数据量中等,采用第二种;反之,第三种是在处理大容量数据分页查询下的理想方案。
示例
在mysql中,实现分页查询比较方便,只需要传入查询开始的条数start和要查询多少条数据即每页显示多少条数据limit就可以
db2和Oracle实现分页的方式类似,所需要的参数为要查询的数据开始的条数start,结尾的条数end,并且在sql语句中还需要设定row_number()(Oracle中为rownum)作为查询的辅助函数,此时要使用select语句的嵌套,嵌套在from子句中进行。
子句为:
select row_number() over ( order by date desc ) as r,e.* from emp e
其中
row_number() 作为人为的添加一列作为给每一条数据进行编号
over()中是实现排序的字段和方式,date是字段名,desc是方式,都可以修改,但是over()为必须写的,不写会报错
as r是为row_number()这个列取的一个别名
真正要分页查询的数据在外面的父句中进行实现
完整的语句为
select * from (
select row_number() over(ORDER BY date DESC) as r,e.*
from emp e
where e.name=’A’)
where r between 1 AND 5
此时的start为1,end为5,要注意between…and是>=1并且<=5实际上查出的是6条数据,所以要注意limit和end之间的处理,可以在action中进行,否则可能会出现每页显示条数不正确或者每一页的最后一条数据和下一页第一条数据重复等问题
还有一种方式是用>=和<=直接实现的
语句为
select * from (
select row_number() over(ORDER BY date DESC) as r,e.*
from emp e
where e.name=’A’ AND r<=5)
where r>0
此时显示的是1-5条数据,因为数据库是从1开始的。
1. db2分页查询sql
select * from (
select ROW_NUMBER() OVER(ORDER BY DOC_UUID DESC) AS ROWNUM, DOC_UUID, DOC_DISPATCHORG, DOC_SIGNER, DOC_TITLE from DT_DOCUMENT ) a
where ROWNUM > 20 and ROWNUM <=30
2.ROW_NUMBER()函数
增加行号,不排序
select * from ( select ROW_NUMBER() OVER() AS ROWNUM,t.* from DT_DOCUMENT t ) a
增加行号,按某列排序
select * from ( select ROW_NUMBER() OVER( ORDER BY DOC_UUID DESC ) AS ROWNUM,t.* from DT_DOCUMENT t ) a