SQL Server2005中四种排名函数的使用

排名函数是SQL Server2005新加的功能。在SQL Server2005中有如下四个排名函数：

　　1. row_number
　　2. rank
　　3. dense_rank
　　4. ntile

下面依次介绍这四个排名函数的使用。这里我使用的是微软提供的实例数据库AdventureWorks。

一、 row_number

　row_number函数的用途是非常广泛，这个函数的功能是为查询出来的每一行记录生成一个序号。row_number函数的用法如下面的SQL语句所示：

　　select row_number() over(order by field1) as row_number,* from t_table

在sql server 2005的分析查询器中输入以下SQL语句。

select row_number() over(order by OrderDate) as Rownumber,*
   from Sales.SalesOrderHeader

其中over(order by OrderDate)是个窗口函数，有关窗口函数的使用参考我博客中的另一篇文章。执行结果如下：（省略部分列）

其中Rownumber列是由row_number函数生成的序号列。在使用row_number函数是要使用over子句选择对某一列进行排序，然后才能生成序号。

实际上，row_number函数生成序号的基本原理是先使用over子句中的排序语句对记录进行排序，然后按着这个顺序生成序号。over子句中的order by子句与SQL语句中的order by子句没有任何关系，这两处的order by 可以完全不同，如下面的SQL语句所示：

 select row_number() over(order by OrderDate) as Rownumber,*
   from Sales.SalesOrderHeader
 order by SalesOrderID Desc

执行结果如下：(省略部分列)

Rownumber列并没有因为SalesOrderID的排序发生值的变化。

我们可以使用row_number()函数来实现查询表中指定范围的记录，一般将其应用到Web应用程序的分页功能上。下面我们查询Rownumber在1到10之间的数据，SQL语句如下：

use AdventureWorks
go
select * from
(
   select row_number() over(order by OrderDate) as Rownumber,*
   from Sales.SalesOrderHeader
)as a
where a.Rownumber between 1 and 10

执行结果如下：

二、 rank（）

rank函数考虑到了over子句中排序字段值相同的情况。在Sql server 2005分析查询器中输入以下SQL语句：

   select rank() over(order by OrderDate) as Rank,*
   from Sales.SalesOrderHeader

执行结果如下：

对于OrderDate相同的字段，rank列的值也是相同的。

三、 dense_rank

dense_rank函数的功能与rank函数类似，只是在生成序号时是连续的，而rank函数生成的序号有可能不连续。如上面的例子中如果rank列有19个1，那下一条记录就是从20开始了。用法如下面的SQL语句所示：

 select dense_rank() over(order by OrderDate) as Rank,*
   from Sales.SalesOrderHeader

四、 ntile

ntile函数可以对序号进行分组处理。这就相当于将查询出来的记录集放到指定长度的数组中，每一个数组元素存放一定数量的记录。ntile函数为每条记录生成的序号就是这条记录所有的数组元素的索引(从1开始)。也可以将每一个分配记录的数组元素称为“桶”。ntile函数有一个参数，用来指定桶数。下面的SQL语句使用ntile函数对t_table表进行了装桶处理：

　select ntile(4) over(order by field1) as bucket,* from t_table

在分析查询器中输入以下sql语句：

 select ntile(4) over(order by OrderDate) as Rank,*
   from Sales.SalesOrderHeader

以上SQL语句的结果把dense_rank()函数生成的结果放在4个桶中，也就是分成四组。

也许你会问这么一个问题，SQL Server2005怎么来决定某一桶应该放多少记录呢?可能t_table表中的记录数有些少，那么我们假设t_table表中有59条记录，而桶数是5，那么每一桶应放多少记录呢?

　　实际上通过两个约定就可以产生一个算法来决定哪一个桶应放多少记录，这两个约定如下：

　　1. 编号小的桶放的记录不能小于编号大的桶。也就是说，第1捅中的记录数只能大于等于第2桶及以后的各桶中的记录。

　　2. 所有桶中的记录要么都相同，要么从某一个记录较少的桶开始后面所有捅的记录数都与该桶的记录数相同。也就是说，如果有个桶，前三桶的记录数都是10，而第4捅的记录数是6，那么第5桶和第6桶的记录数也必须是6。

　　根据上面的两个约定，可以得出如下的算法：

// mod表示取余，div表示取整 
　　if(记录总数 mod 桶数 == 0) 
　　{ 
　　recordCount = 记录总数 div 桶数; 
　　将每桶的记录数都设为recordCount 
　　} 
　　else 
　　{ 
　　recordCount1 = 记录总数 div 桶数 + 1; 
　　int n = 1; // n表示桶中记录数为recordCount1的最大桶数 
　　m = recordCount1 * n; 
　　while(((记录总数 - m) mod (桶数 - n)) != 0 ) 
　　{ 
　　n++; 
　　m = recordCount1 * n; 
　　} 
　　recordCount2 = (记录总数 - m) div (桶数 - n); 
　　将前n个桶的记录数设为recordCount1 
　　将n + 1个至后面所有桶的记录数设为recordCount2 
　　}

　　根据上面的算法，如果记录总数为59，桶数为5，则前4个桶的记录数都是12，最后一个桶的记录数是11。

　　如果记录总数为53，桶数为5，则前3个桶的记录数为11，后2个桶的记录数为10。

posted on 2010-12-10 11:39 流水殇阅读(1366) 评论(1) 编辑收藏举报