高级查询

  本篇文章示例介绍的查询操作不同于其他查询操作,它们体现了不同的查询思路,需要以每次一页的方式显示结果集。

 

1.在结果集中翻页

  问题:返回员工表中薪水排名前五的员工,然后再返回接下来排名前五的员工。

  解决方案:这个问题看起来很简单,只需要根据“薪水”这一列进行倒序排序,然后分页操作即可。但是如果存在重复数据时就会有问题。

  先按照“薪水”这一列进行倒序排序:

  

 

  然后分页取排名前五的数据:

  

 

 

   看似没问题,但是题目要求返回的是薪水排名前五的数据。因为这里有薪水相同的数据,返回的数据其实不止五条。应该返回下面框起来的数据:

  

 

 

   遇到这种情况,需要使用窗函数 rank() over 给每条数据进行排名(当前行在其分区内的排名,有间隙。要无间隙可以使用 dense_rank 。不使用ROW_NUMBER() ,该函数不区分使用并列),然后使用 between and 语法分页。

select * from (
SELECT *,rank() over(order by SAL desc) as rn FROM test.emps ) a where rn between 1 and 5

  

 

 

 

2.在表中跳过 n 行数据

  问题:以每次跳过一人的方式返回员工表中的数据。换言之,想返回第一个员工,第三个员工 ......

  解决方案:先对结果集排序,否则不存在“第一个”,“第二个”,“下一个”的概念。然后使用窗函数 ROW_NUMBER() 给每一行进行编号,再结合这些编号和求模函数 mod() 跳过不想返回的行。

select *,mod(rn,2) from (
select *,row_number() over(order by id) as rn from emps ) a
where mod(rn,2) = 1

  

 

 

 

3.确定哪些行是互逆的

  问题:有一张包含两次考试结果的表,想确定哪两组成绩是互逆的。

  

 

 

   从这些数据可知,Test1 为70、Test2 为90与Test1 为90、Test2 为70 是互逆的。Test1 为20、Test2 为20与Test1 为20、Test2 为20 是互逆的。希望返回如下结果:

  

 

 

   解决方案:使用自连接找出这样的行,即一行的 Test1 和Test2 与 另一行的 Test2和Test1 相等。然后去重。

SELECT a.test1,a.test2 FROM test.grades a
join test.grades b on a.test1=b.test2 and a.test2 = b.test1
where a.id < b.id

  这里使用 a.id < b.id 去重。

 

4.平移行值

  问题:返回每位员工的姓名,薪水,下一个更高和更低的薪水值。如果没有更高或更低的薪水值,就执行回转操作。即如果当前员工的薪水是最低的,则将它的下一个更低的薪水值设置为最高的薪水;如果当前员工的薪水是最高的,就将它的下一个更高的薪水设置为最低的薪水。

  解决方案:使用窗函数 Lead over 和 Lag over 可以轻松取到前一行和后一行数据。然后使用 min 和 max 获取最小和最大值。

  第一步:取下一行数据的薪水作为当前行的下一个更高的薪水,取上一行的薪水作为下一个更低薪水

select ename,sal,lead(sal) over(order by sal) 下一个更高的薪水,lag(sal) over(order by sal) 下一个更低薪水 from emps

  

 

 

   第二步:处理第一行和最后一行

select ename,sal,
coalesce( lead(sal) over(order by sal),min(sal) over()) 下一个更高的薪水,
coalesce( lag(sal) over(order by sal),max(sal) over()) 下一个更低薪水 from emps

  

 

 

 

5.消除重复行

  问题:找出员工表中不同的部门编号,但不想看到重复的行。

  解决方案:最简单的方法是使用 distinct 关键字或者使用 group by 。另一种解决方法是,使用窗函数 row_number over 。

select * from (
select DeptNo,row_number() over(partition by  DeptNo order by deptno) as rn  from emps ) a
where rn = 1

  row_number() over(partition by  DeptNo order by deptno) as rn 根据部门编号分区,给分区内每一行进行编号。然后取分区内第一行。

  

 

 

 

6.查找马值

  问题:返回一个结果集,包含员工名字、部门编号、薪水、获聘日期以及所属部门最后聘请的员工的薪水。

    所属部门最后聘请的员工的薪水就是马值,因为查找这些值的方法与国际象棋中马的走法类似。先跳到某一行,然后跳到某一列。同样,要找到所属部门最后聘请的员工的薪水,必须先定位到最后获聘日期所在的行,然后获取该行的薪水值。

  解决方案:使用  max(HireDate) over(partition by DeptNo)  和 case when 语法找出所属部门最后聘请的员工。再次使用 Max Over 获取所属部门最后聘请的员工的薪水值。

select DeptNo,Ename,Sal,HireDate, max(Lastest_Sal) over(partition by DeptNo) from (
select DeptNo,Ename,Sal,HireDate,
case  max(HireDate) over(partition by DeptNo) 
    when HireDate then SAL else 0 
    end  as Lastest_Sal
    from emps ) a

 

7.生成简单预测

  问题:根据当前的数据返回表示未来行动的行和列。例如,下面有三行订单数据:

  

 

   每行数据包含下单日期和处理日期(下单两天后)。现在想对每行数据都返回三行(当前行和另外两行),还想返回另外两列,订单核验日期(订单处理一天后)和发货日期(订单核验一天后)。并且想返回一个呈现整个过程的结果集,下图的样子:

  

 

   

  解决方案:使用笛卡尔积为每行订单再生成两行树,然后使用 Case 表达式来创建所需的列值。

with recursive t3 (n) as
(
    select 1 as n
    union all
    select n+1 from t3 where n< 3
)


select id, OrderDate 下单日期,processDate 处理日期, 
case when n >= 2 then adddate(OrderDate,interval 1 day)
    else '' end as 核验日期,
case when n>2 then adddate(OrderDate,interval 2 day)
    else '' end as 发货日期
 from orders o
join t3

 

posted @ 2022-09-04 12:16  Ruby_Lu  阅读(382)  评论(0编辑  收藏  举报