一道面试题引发的数据库SQL语句实践(含行列转换)

问题场景

最近有个朋友去面试,问了我一道面试题。题目如下,在形如下面的数据库表score中,找出每门成绩(grade)都大于等于80分的学生姓名。

----------------------------------------
name      | course  | grade
----------------------------------------
zhangsan  | Java   | 70
----------------------------------------
zhangsan  | C++    | 80
----------------------------------------
lisi     | Java   | 90
----------------------------------------
lisi     | C++    | 60
----------------------------------------
wangwu   | Java   | 85
----------------------------------------
wangwu   | C++   | 95
----------------------------------------
 
期望结果
----------------------------------------
name
----------------------------------------
wangwu
----------------------------------------
 
本文以MySQL数据库为例,以三种方案一步一步实现面试题要求。
 
方案一
1、寻求行列转换,也称矩阵转置,将多列数据转为一行,这一步最关键,实现SQL语句如下:
下面的sql是以score为主表来构建多列,构造的从表为每门课程的数据表,通过主表的 name 字段来关联从表的 name 字段。
select s.`name` as name,
(select grade from score where name = s.`name` and course = 'Java')as 'Java',
(select grade from score where name = s.`name` and course = 'C++')as 'C++'
from score s

运行结果截图:

 
2、对于1的执行结果,需要过滤掉重复的行,只要通过 distinct 关键字就可以了,实现SQL语句如下:
select distinct s.`name` as name,#此处加distinct来过滤相同的行
(select grade from score where name = s.`name` and course = 'Java')as 'Java',
(select grade from score where name = s.`name` and course = 'C++')as 'C++'
from score s

运行结果截图:

3、最后通过构造一个子查询,即是把上面2的查询结果作为一个表来查询,进行 where 行级过滤就可以了,实现SQL语句如下:

select *
from
(
    select distinct s.`name` as name,#此处加distinct来过滤相同的行
    (select grade from score where name = s.`name` and course = 'Java')as G1,
    (select grade from score where name = s.`name` and course = 'C++')as G2
    from score s
) score
where G1>=80 and G2>=80

运行结果截图:

问题:这里有一个问题指出下,如果写成如下的sql语句,把Java和C++作为列名的话(还有C#),查询结果为NULL,这个问题后续会详解,请见运行结果截图:

select *
from
(
    select distinct s.`name` as name,#此处加distinct来过滤相同的行
    (select grade from score where name = s.`name` and course = 'Java')as 'Java',
    (select grade from score where name = s.`name` and course = 'C++')as 'C++'
    from score s
) score
where 'Java'>=80 and 'C++'>=80

运行结果截图:

方案二

1、通过group和聚合函数sum的结合使用,通过group by name分组,利用sum假模假样计算出每门课程的成绩,sum的时候利用case判断课程类别,就得到了以行显示的每个学生的每门课程成绩,这一步最关键,实现SQL语句如下:

select name,
sum(case when course='Java' then grade end) as 'Java',
sum(case when course='C++' then grade end) as 'C++'
from score group by name

运行结果截图:

2、再通过构造一个子查询,即是把上面1的查询结果作为一个表来查询,进行 where 行级过滤就可以了,实现SQL语句如下:

select *
from
(
select  name,
sum(case when course='Java' then grade end) as G1,
sum(case when course='C++' then grade end) as G2
from score group by name
) score
where G1>=80 and G2>=80

运行结果截图:

方案三

1、先找出有任意课程<80分的学生,实现SQL语句如下:

select distinct name
from score
where grade<80

运行结果截图:

2、distinct出所有学生列表(不重复),实现SQL语句如下:

select distinct name
from score

运行结果截图:

3、通过构造子查询从查询2的结果排除出去查询1的结果,这一步骤有的数据库是有集合函数,比如SQL Server的Except,这儿我们用not exists进行行级过滤,实现SQL语句如下:

select *
from
(
    select distinct name
    from score
) score1
where not exists
(
    select *
    from
    (
        select distinct name
        from score
        where grade<80
    ) score2
    where score1.name=score2.name
)

运行结果截图:

总结

个人推荐第二种方案,第三种方案也不错,随着课程数的增多,第一种方案的执行效率理论上会很差,光第一步就要执行M*N(M-score表记录数,N-课程数)次关联。

思考

现实中数据更倾向于下面的情形。对于此问题场景,规则的数据是很好处理的(即每位学生都仅有Java、C++两门课程的成绩),但是考虑现实生活场景,每位学生由于专业或者兴趣差异,选修的课程可能不一样,所以有些课程是没有成绩的(学生没有某些课程成绩,但是在行列转换的时候会生成此门课程成绩为NULL的行记录的列,这部分课程是不适用大于等于80分这个条件,是不参与这个条件过滤的)。sql要做下处理,不过实现思路同上述三种方案。

----------------------------------------
name     | course  | grade
----------------------------------------
zhangsan  | Java   | 70
----------------------------------------
zhangsan  | C++    | 80
----------------------------------------
lisi     | Python | 90
----------------------------------------
lisi     | C#     | 60
----------------------------------------
wangwu   | iOS    | 85
----------------------------------------
wangwu   | Android | 95
----------------------------------------

数据库脚本

/*
Navicat MySQL Data Transfer

Source Server : localhost
Source Server Version : 50538
Source Host : 127.0.0.1
Source Database : test

Target Server Type : MYSQL
Target Server Version : 50538
File Encoding : 65001

Date: 2017-08-22 16:40:30
*/

SET FOREIGN_KEY_CHECKS=0;

-- ----------------------------
-- Table structure for `score`
-- ----------------------------
DROP TABLE IF EXISTS `score`;
CREATE TABLE `score` (
`name` varchar(20) DEFAULT NULL,
`course` varchar(20) DEFAULT NULL,
`grade` int(11) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

-- ----------------------------
-- Records of score
-- ----------------------------
INSERT INTO `score` VALUES ('zhangsan', 'Java', '70');
INSERT INTO `score` VALUES ('zhangsan', 'C++', '80');
INSERT INTO `score` VALUES ('lisi', 'Java', '90');
INSERT INTO `score` VALUES ('lisi', 'C++', '60');
INSERT INTO `score` VALUES ('wangwu', 'Java', '85');
INSERT INTO `score` VALUES ('wangwu', 'C++', '95');

原创声明

本文原创,欢迎转载,转载请声明出处:http://www.cnblogs.com/chenlin/p/7412253.html

个人水平有限,欢迎大牛大神大虾来拍砖指正!

posted @ 2017-08-22 16:30  josslin  阅读(791)  评论(0编辑  收藏  举报