一道面试题引发的数据库SQL语句实践(含行列转换)
问题场景
最近有个朋友去面试,问了我一道面试题。题目如下,在形如下面的数据库表score中,找出每门成绩(grade)都大于等于80分的学生姓名。
----------------------------------------
name
| course | grade
----------------------------------------
zhangsan | Java | 70
----------------------------------------
zhangsan | C++ | 80
----------------------------------------
lisi | Java | 90
----------------------------------------
lisi | C++ | 60
----------------------------------------
wangwu | Java | 85
----------------------------------------
wangwu | C++ | 95
----------------------------------------
----------------------------------------
name
----------------------------------------
wangwu
----------------------------------------
select s.`name` as name,
(select grade from score where name = s.`name` and course = 'Java')as 'Java',
(select grade from score where name = s.`name` and course = 'C++')as 'C++'
from score s
运行结果截图:
select distinct s.`name` as name,#此处加distinct来过滤相同的行
(select grade from score where name = s.`name` and course = 'Java')as 'Java',
(select grade from score where name = s.`name` and course = 'C++')as 'C++'
from score s
运行结果截图:
3、最后通过构造一个子查询,即是把上面2的查询结果作为一个表来查询,进行 where 行级过滤就可以了,实现SQL语句如下:
select *
from
(
select distinct s.`name` as name,#此处加distinct来过滤相同的行
(select grade from score where name = s.`name` and course = 'Java')as G1,
(select grade from score where name = s.`name` and course = 'C++')as G2
from score s
) score
where G1>=80 and G2>=80
运行结果截图:
问题:这里有一个问题指出下,如果写成如下的sql语句,把Java和C++作为列名的话(还有C#),查询结果为NULL,这个问题后续会详解,请见运行结果截图:
select *
from
(
select distinct s.`name` as name,#此处加distinct来过滤相同的行
(select grade from score where name = s.`name` and course = 'Java')as 'Java',
(select grade from score where name = s.`name` and course = 'C++')as 'C++'
from score s
) score
where 'Java'>=80 and 'C++'>=80
运行结果截图:
方案二
1、通过group和聚合函数sum的结合使用,通过group by name分组,利用sum假模假样计算出每门课程的成绩,sum的时候利用case判断课程类别,就得到了以行显示的每个学生的每门课程成绩,这一步最关键,实现SQL语句如下:
select name, sum(case when course='Java' then grade end) as 'Java', sum(case when course='C++' then grade end) as 'C++' from score group by name
运行结果截图:
2、再通过构造一个子查询,即是把上面1的查询结果作为一个表来查询,进行 where 行级过滤就可以了,实现SQL语句如下:
select * from ( select name, sum(case when course='Java' then grade end) as G1, sum(case when course='C++' then grade end) as G2 from score group by name ) score where G1>=80 and G2>=80
运行结果截图:
方案三
1、先找出有任意课程<80分的学生,实现SQL语句如下:
select distinct name from score where grade<80
运行结果截图:
2、distinct出所有学生列表(不重复),实现SQL语句如下:
select distinct name from score
运行结果截图:
3、通过构造子查询从查询2的结果排除出去查询1的结果,这一步骤有的数据库是有集合函数,比如SQL Server的Except,这儿我们用not exists进行行级过滤,实现SQL语句如下:
select * from ( select distinct name from score ) score1 where not exists ( select * from ( select distinct name from score where grade<80 ) score2 where score1.name=score2.name )
运行结果截图:
总结
个人推荐第二种方案,第三种方案也不错,随着课程数的增多,第一种方案的执行效率理论上会很差,光第一步就要执行M*N(M-score表记录数,N-课程数)次关联。
思考
现实中数据更倾向于下面的情形。对于此问题场景,规则的数据是很好处理的(即每位学生都仅有Java、C++两门课程的成绩),但是考虑现实生活场景,每位学生由于专业或者兴趣差异,选修的课程可能不一样,所以有些课程是没有成绩的(学生没有某些课程成绩,但是在行列转换的时候会生成此门课程成绩为NULL的行记录的列,这部分课程是不适用大于等于80分这个条件,是不参与这个条件过滤的)。sql要做下处理,不过实现思路同上述三种方案。
----------------------------------------
name
| course | grade
----------------------------------------
zhangsan | Java | 70
----------------------------------------
zhangsan | C++ | 80
----------------------------------------
lisi | Python | 90
----------------------------------------
lisi | C# | 60
----------------------------------------
wangwu | iOS | 85
----------------------------------------
wangwu | Android | 95
----------------------------------------
数据库脚本
/*
Navicat MySQL Data Transfer
Source Server : localhost
Source Server Version : 50538
Source Host : 127.0.0.1
Source Database : test
Target Server Type : MYSQL
Target Server Version : 50538
File Encoding : 65001
Date: 2017-08-22 16:40:30
*/
SET FOREIGN_KEY_CHECKS=0;
-- ----------------------------
-- Table structure for `score`
-- ----------------------------
DROP TABLE IF EXISTS `score`;
CREATE TABLE `score` (
`name` varchar(20) DEFAULT NULL,
`course` varchar(20) DEFAULT NULL,
`grade` int(11) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
-- ----------------------------
-- Records of score
-- ----------------------------
INSERT INTO `score` VALUES ('zhangsan', 'Java', '70');
INSERT INTO `score` VALUES ('zhangsan', 'C++', '80');
INSERT INTO `score` VALUES ('lisi', 'Java', '90');
INSERT INTO `score` VALUES ('lisi', 'C++', '60');
INSERT INTO `score` VALUES ('wangwu', 'Java', '85');
INSERT INTO `score` VALUES ('wangwu', 'C++', '95');
原创声明
本文原创,欢迎转载,转载请声明出处:http://www.cnblogs.com/chenlin/p/7412253.html
个人水平有限,欢迎大牛大神大虾来拍砖指正!