T-SQL在MSSQL2005/2008中新增的几个功能

 
  • Ranking函数
          MSSQL2005新增了四个排名函数,ROW_NUMBER, RANK, DENSE_RANK, NTILE。利用这些函数可以有效地分析数据以及向查询的结果行提供排序值。
          下面举例说明。先准备数据: 
     
    测试表和测试数据
    1CREATE TABLE [Test]
    2(
    3 [StudentID] [bigint] NOT NULL,
    4 [ClassID] [bigint] NOT NULL,
    5 [TestScore] [decimal](4, 1) NOT NULL
    6) ON [PRIMARY]
    7 GO
    8
    9 INSERT INTO [Test]
    10 VALUES (100001,100,90),
    11 (100002,100,85.5),
    12 (100003,100,80),
    13 (100004,100,80),
    14 (100005,100,74),
    15 (101001,101,94),
    16 (101002,101,85.5),
    17 (101003,101,85.5)
    18 GO
    19 
          
          下面是四个排序函数统一的示例和结果,可以做一比较。下面的小节来会逐一据此描述每个函数。
      
    Ranking示例
    1SELECT *,
    2 ROW_NUMBER() OVER (ORDER BY TestScore DESC) as RN,
    3 RANK() OVER (ORDER BY TestScore DESC) as R,
    4 DENSE_RANK() OVER (ORDER BY TestScore DESC) as DR,
    5 NTILE(3) OVER (ORDER BY TestScore DESC) as N3
    6 FROM [TEST]
    7 GO
    8 
      
      
    ROW_NUMBER
          行号函数。用来生成数据行在结果集中的序号
          语法:
    ROW_NUMBER( ) OVER ([<partition_by_clause>] <order_by_clause>)
          
          可以利用ROW_NUMBER函数非常便利的实现分页功能,例如:
     
    1SELECT *, ROW_NUMBER() OVER (ORDER BY TestScore DESC) as RN
    2 FROM [TEST]
    3 WHERE RN BETWEEN 6 AND 10
    4 
     
    RANK
          排序函数。必须配合over函数,且排序字段值相同的行号一样,同时隐藏行号会占位。
          语法:
    RANK() OVER ([<partition_by_clause>] <order_by_clause>)
        
          还可以利用partition进行分组排序,例如对每个班级分别按成绩排序:
     
    1SELECT *, RANK() OVER (PARTITION BY ClassID ORDER BY TestScore DESC) as R
    2 FROM [Test]
    3 
     
     
    DENSE_RANK
          紧凑排序函数。与RANK函数不同的是,当排序字段值相同导致行号一样时,同时隐藏行号不占位。
          语法:
    DENSE_RANK ( ) OVER ([<partition_by_clause>] <order_by_clause>)
        
          从第一个结果集中可以看到,DENSE_RANK得到的行号是3,3,3,4,4,5,而RANK函数得到的3,3,3,6,6,8
     
    NTILE
          分区排序函数。NTILE函数需要一个参数N,这个参数支持bigint。这个函数将结果集等分成N个区,并按排序字段将已排序的记录依次轮流放入各个区内。最后每个区内会从1开始编号,NTILE函数返回这个编号。
          语法:
    NTILE (integer_expression) OVER ([<partition_by_clause>]< order_by_clause>)
     
          这个函数可以用来按权值均分记录。      
          从第一个结果集可以看到被分成了3个区,因为8条记录不能被平分,所以第3个区只有2条记录。排序的记录被依次按第1->2->3->1区的顺序分配,最终函数的返回是每个区内记录的序号。   
             
  • CTE
  •        Common Table Expression,通用表表达式,是一个可以由定义语句引用临时表命名的结果集。可以在所有的CURD操作中使用CTECTE可以省去创建和维护临时表或者表变量的工作。
          语法:
    WITH <cte_alias>(<column_aliases>)
    AS
    (
    <cte_query>
    )
          根据第1节的数据提供一个示例,获取每个班级第一名的数据: 
     
    CTE示例
    1 ;WITH Test_RN
    2  AS
    3 (
    4 SELECT StudentID, ClassID, TestScore,RANK() OVER (PARTITION BY ClassID ORDER BY TestScore DESC) as RN
    5 From Test
    6 )
    7  Select * FROM Test_RN WHERE RN=1
     
     
     
          需要特别提出的是CTE更为强大的一个功能,可以在递归中使用。
          递归 CTE 定义至少必须包含两个 CTE 查询定义,一个定位点成员(只能调用一次),一个递归成员(可以反复调用,直到查询不再返回行),使用 UNION ALL连接成一个单独的CTE
          我们举一个示例,有一张部门表:
     
    测试表和测试数据
    1 CREATE TABLE [Dept]
    2 (
    3 [DeptID] [bigint] NOT NULL,
    4 [DeptName] [nvarchar](50) NOT NULL,
    5 [ParentDeptID] [bigint] NOT NULL
    6 ) ON [PRIMARY]
    7 GO
    8
    9 INSERT INTO [SSIP-SSO].[dbo].[Dept]
    10 VALUES
    11 (1, '集团', 0),
    12 (2, '总公司', 1),
    13 (3, '技术部', 2),
    14 (4, '开发组', 3),
    15 (5, '测试部', 3),
    16 (6, '财务部', 2),
    17 (7, '分公司', 1),
    18 (8, '工程部', 7),
    19 (9, '设备组', 8),
    20 (10, '客服部', 7)
    21 GO
         
          我们需要获取“总公司”下所有部门的信息:
     
    递归CTE示例
    1 ;WITH Dept_Head
    2 AS
    3 (
    4 SELECT DeptID, DeptName, ParentDeptID
    5 FROM Dept
    6 WHERE DeptName = '总公司'
    7 UNION ALL
    8 SELECT Dept.DeptID, Dept.DeptName, Dept.ParentDeptID
    9 FROM Dept, Dept_Head
    10 WHERE Dept.ParentDeptID = Dept_Head.DeptID
    11 )
    12 Select * FROM Dept_Head
      
        
  • Merge 
  •     MERGE语法是MSSQL2008新增的功能,将源表与目标表关联,并根据结果对目标表执行插入、更新或删除操作。常规操作需要自行比对结果,利用一系列的IF-ELSE和CASE-WHEN,根据逻辑判断执行不同的操作。MERGE语法则提供了内建的支持,更加灵活。
          语法:
    MERGE
    [ TOP ( expression ) [ PERCENT ] ]
    [ INTO ] <target_table> [ WITH ( <merge_hint> ) ] [ [ AS ] table_alias ]
    USING <table_source> 
    ON <merge_search_condition>
    [ WHEN MATCHED [ AND <clause_search_condition> ]
        THEN <merge_matched> ] [ ...n ]
    [ WHEN NOT MATCHED [ BY TARGET ] [ AND <clause_search_condition> ]
        THEN <merge_not_matched> ]
    [ WHEN NOT MATCHED BY SOURCE [ AND <clause_search_condition> ]
        THEN <merge_matched> ] [ ...n ]
    [ <output_clause> ]
    [ OPTION ( <query_hint> [ ,...n ] ) ]
    ;
     
           将第1节的TEST表作为目标表,准备一个源表:
         
    测试表和测试数据
    1 CREATE TABLE [NewTest]
    2 (
    3 [StudentID] [bigint] NOT NULL,
    4 [TestScore] [decimal](4, 1) NOT NULL
    5 ) ON [PRIMARY]
    6 GO
    7
    8 INSERT INTO [NewTest]
    9 VALUES (100001,90),
    10 (100003,85.5),
    11 (100004,77),
    12 (101001,90),
    13 (101002,90),
    14 (101003,85.5),
    15 (101004,88)
    16 GO
         
          比较源表和目标表发现,有的记录两表中一致;有的两表中部分一致;有的只存在源表中;有的只存在目标表中。我们需要以源表为标准来更新目标表。
       
    Merge示例
    1 MERGE Test
    2 USING NewTest
    3 ON Test.StudentID = NewTest.StudentID
    4 WHEN MATCHED --记录两表匹配
    5   THEN UPDATE SET Test.TestScore = NewTest.TestScore
    6 WHEN NOT MATCHED --记录在目标表不存在
    7   THEN INSERT VALUES (NewTest.StudentID,NewTest.StudentID/1000, NewTest.TestScore)
    8 WHEN NOT MATCHED BY SOURCE --记录在源表中不存在
    9   THEN DELETE
    10 ;
       
         
         
          还可以带OUTPUT命令同时获得MERGE命令中更新的记录。
          OUTPUT $action, Deleted.*, Inserted.*   
     

posted @ 2011-01-11 18:31  reni  阅读(754)  评论(0编辑  收藏  举报