牛客-SQL-刷题（上）

牛客 SQL题目

SQLite数据库 3.7.9

细节：SQL对大小写不敏感，但在大型ERP系统开发时显得重要，操作系统会将所有字符转换为大写
所以在平时习惯用大写

1. 分页查询employees表，每5行一页，返回第2页的数据

分析：第2页数据，即第6-10条

SELECT * FROM employees LIMIT 5,5;

LIMIT n,m：从第n条记录开始，返回m条记录；第1条记录是0

2. 查找字符串'10,A,B' 中逗号','出现的次数cnt

分析：统计子串出现次数问题

SELECT (LENGTH('10,A,B')-LENGTH(REPLACE('10,A,B',',','')))/LENGTH(',') cnt;

( LENGTH(str)-LENGTH(REPLACE(str,substr,’ ’)) )/ LENGTH (substr)
REPLACE( str, substr, replacestr) 在str中，用replacestr替换subst

3. 将id=5以及emp_no=10001的行数据替换成id=5以及emp_no=10005,其他数据保持不变，使用replace实现.

分析：更新titles_test的行数据（题目中已显示所有插入数据信息）

REPLACE INTO titles_test VALUES (5, 10005, 'Senior Engineer', '1986-06-26', '9999-01-01');

REPLACE INTO table VALUES(…) 重新插入一条完整的新纪录，SQL会将id相同的记录自动替换

UPDATE titles_test SET emp_no=REPLACE(emp_no,10001,10005) 
WHERE id=5;

UPDATE 表名 SET colum=[new value] WHERE …

4. 获取Employees中的first_name，查询按照first_name最后两个字母，按照升序进行排列

分析：考察SUBSTR()

SELECT first_name FROM employees ORDER BY SUBSTR(first_name,-2);

SUBSTR(str, start, length)：在str中从start位置开始截取长度为length的子串
start参数：必选，第一个位置是1；倒数第一个位置是-1；length参数：可选，缺省默认到末尾字符

5. 将titles_test表名修改为titles_2017

分析：修改表名

ALTER TABLE titles_test RENAME TO titles_2017;

加上一个column：ALTER TABLE 表名 ADD 列名列种类
删去一个column：ALTER TABLE 表名 DROP 列名
改变column名称：ALTER TABLE 表名 CHANGE 旧列名新列名新列种类
改变column种类：ALTER TABLE 表名 MODIFY 列名新列种类
该表table名称：ALTER TABLE 旧表名 RENAME TO 新表名

6. 删除emp_no重复的记录，只保留最小的id对应的记录

分析：找到emp_no重复的记录 --> GROUP BY emp_no HAVING COUNT(emp_no)>1

注意点1：因为这里要保留最小的id，即需要用到MIN(id)，所以一定要有GROUP BY语句

注意点2：在找要删除的id时，不能使用MAX(id)，因为这样默认只有2条重复的语句

注意点3：子查询表的结果时也要加重命名

正向思维：

1. 找到emp_no重复、且id最小的记录

SELECT emp_no, MIN(id) id FROM titles_test GROUP BY emp_no HAVING COUNT(emp_no)>1

2. 联合之前的表，找到需要删除的id

SELECT a.id FROM titles_test a, (SELECT emp_no, MIN(id) id FROM titles_test GROUP BY emp_no HAVING COUNT(emp_no)>1) b

WHERE a.emp_no=b.emp_no AND a.id>b.id

3. 根据id删除行

DELETE FROM titles_test
WHERE id IN 
(SELECT * FROM
(SELECT a.id FROM titles_test a, (SELECT emp_no, MIN(id) id FROM titles_test GROUP BY emp_no HAVING COUNT(emp_no)>1) b
WHERE a.emp_no=b.emp_no AND a.id>b.id) c);

逆向思维：

删除重复的、不是最小id的记录

优化：不需要HAVING子句

DELETE FROM titles_test
WHERE id NOT IN 
(SELECT * FROM
(SELECT MIN(id) id FROM titles_test GROUP BY emp_no) a);

7. 按照dept_no进行汇总，属于同一个部门的emp_no按照逗号进行连接，结果给出dept_no以及连接出的结果employees

分析：知识盲区：聚合函数GROUP_CONCAT(X,Y)，必须与GROUP BY联合使用

GROUP_CONCAT(X,Y)： X必选，是需要连接的字段；Y可选，是连接的符号，缺省是默认为逗号

SELECT dept_no, GROUP_CONCAT(emp_no) employees FROM dept_emp
GROUP BY dept_no;

8. 从titles表获取按照title进行分组，每组个数大于等于2，给出title以及对应的数目t

分析：基本操作：GROUP BY 联合HAVING COUNT(*)

优化：可以写成HAVING t>=2

SELECT title, COUNT(*) t FROM titles
GROUP BY title
HAVING COUNT(title)>=2;

9. 将所有to_date为9999-01-01的全部更新为NULL,且 from_date更新为2001-01-01

分析：考察UPDATE语句：用逗号连接，不是用AND

UPDATE titles_test SET to_date = NULL, from_date = '2001-01-01'
WHERE to_date = '9999-01-01';

10. 对于表actor批量插入如下数据

actor_id	first_name	last_name	last_update
1	PENELOPE	GUINESS	2006-02-15 12:34:33
2	NICK	WAHLBERG	2006-02-15 12:34:33

分析：要求在一条语句中执行完成

知识盲区：在VALUES语句后用','隔开不同的插入记录；第9题的更新多条记录也是如此

INSERT INTO actor VALUES(1,'PENELOPE','GUINESS','2006-02-15 12:34:33'),(2,'NICK','WAHLBERG','2006-02-15 12:34:33');

11. 对于表actor批量插入如下数据,如果数据已经存在，请忽略，不使用replace操作

分析：知识盲区：INSERT OR IGNORE INTO 表名 VALUES(...)

INSERT OR IGNORE INTO actor VALUES(3,'ED','CHASE','2006-02-15 12:34:33');

12. 将employees表中的所有员工的last_name和first_name通过(')连接起来

分析：要按SQLite数据库中的连接符 || 来连接字符

MySQL中可以：SELECT CONCAT(last_name,"'",first_name) name FROM employees

SELECT last_name|| "'"|| first_name  name FROM employees;

--代码颜色没有分好...

13. 针对库中的所有表生成select count(*)对应的SQL语句

对应输出应为：

cnts
select count(*) from employees;
select count(*) from departments;
select count(*) from dept_emp;
select count(*) from dept_manager;
select count(*) from salaries;
select count(*) from titles;
select count(*) from emp_bonus;

分析：知识盲区：SQLite数据库的内置表sqlite_master

参考：https://blog.csdn.net/jingcheng345413/article/details/70155254

表结构为：

CREATE TABLE sqlite_master ( 
type TEXT, 
name TEXT, 
tbl_name TEXT, 
rootpage INTEGER, 
sql TEXT 
);

　　应用场景1：查询表信息：返回的sql字段为创建此表的sql语句

SELECT * FROM sqlite_master
WHERE type='table' and name='表名'；

　　应用场景2：查询索引信息：返回的tbl_table为该索引所在的表，sql字段为创建此索引的sql语句

SELECT * FROM sqlite_master
WHERE type='index' and name='索引名'；

本题解法：

SELECT 'select count(*) from ' || name || ';' cnts FROM sqlite_master 
WHERE type='table';

14. 针对actor表创建视图actor_name_view，只包含first_name以及last_name两列，并对这两列重新命名，first_name为first_name_v，last_name修改为last_name_v

分析：创建视图的基础操作 CREATE VIEW 视图名 AS ...

CREATE VIEW actor_name_view
AS SELECT first_name first_name_v, last_name last_name_v FROM actor;

15. 找出所有员工当前(to_date='9999-01-01')具体的薪水salary情况，对于相同的薪水只显示一次,并按照逆序显示

分析：用DISTINCT语句去重

SELECT DISTINCT(salary) salary FROM salaries
WHERE to_date='9999-01-01'
ORDER BY salary DESC;

16. 查找员工编号emp_no为10001其自入职以来的薪水salary涨幅值growth

分析：涨幅即为一个周期内的最大绝对值，个人觉得即使降薪，也不需要按照日期排序

另外，SELECT 数1- 数2 growth，后面不需要FROM salaries，否则会返回n条记录

SELECT MAX(salary)-MIN(salary) growth FROM salaries
WHERE emp_no=10001;

17. 将所有获取奖金的员工(bonus表)当前的薪水(salaries表)增加10%。

分析：用WHERE emp_no IN ... 语句，不能直接上来就等于

是要找两张表中emp_no一样的记录，取个交集，用表A INNER JOIN 表B ON...

且to_date='9999-01-01'表示当前的

UPDATE salaries SET salary=salary*1.1
WHERE emp_no IN
(SELECT a.emp_no FROM salaries a 
INNER JOIN emp_bonus b
ON a.emp_no=b.emp_no and a.to_date='9999-01-01');

18. 查找employees表所有emp_no为奇数，且last_name不为Mary的员工信息，并按照hire_date逆序排列

分析：用WHERE子句查询的基本操作，奇数用%判断 num%2=1，或者位运算 num&1=1

SELECT * FROM employees
WHERE emp_no%2=1 AND last_name !='Mary'
ORDER BY hire_date DESC;

19. 使用子查询的方式找出属于Action分类的所有电影对应的title,description

film表

字段	说明
film_id	电影id
title	电影名称
description	电影描述信息

CREATE TABLE IF NOT EXISTS film (film_id smallint(5) NOT NULL DEFAULT '0', title varchar(255) NOT NULL, description text,PRIMARY KEY (film_id));

category表

字段	说明
category_id	电影分类id
name	电影分类名称
last_update	电影分类最后更新时间

CREATE TABLE category (category_id tinyint(3) NOT NULL , name varchar(25) NOT NULL, `last_update` timestamp, PRIMARY KEY ( category_id ));

film_category表

字段	说明
film_id	电影id
category_id	电影分类id
last_update	电影id和分类id对应关系的最后更新时间

CREATE TABLE film_category (film_id smallint(5) NOT NULL,category_id tinyint(3) NOT NULL, `last_update` timestamp);

分析：
根据category中的name='Action',找film表中的title和description
要通过category表的category_id --> film_category表的category_id
通过film_category表的film_id --> film表的film_id

SELECT title,description FROM film
WHERE film_id IN
(SELECT a.film_id FROM film_category a
INNER JOIN  category b
ON a.category_id=b.category_id and b.name='Action');

20. 针对如下表actor结构创建索引：
CREATE TABLE IF NOT EXISTS actor (
actor_id smallint(5) NOT NULL PRIMARY KEY,
first_name varchar(45) NOT NULL,
last_name varchar(45) NOT NULL,
last_update timestamp NOT NULL DEFAULT (datetime('now','localtime')))
对first_name创建唯一索引uniq_idx_firstname，对last_name创建普通索引idx_lastname

分析：知识小盲区：创建唯一索引：CREATE UNIQUE INDEX 索引名 ON 表名(列名)

注意一句sql结束后有分号';'

CREATE UNIQUE INDEX uniq_idx_firstname ON actor(first_name);
CREATE INDEX idx_lastname ON actor(last_name);

21. 对于如下表actor，其对应的数据为:

actor_id	first_name	last_name	last_update
1	PENELOPE	GUINESS	2006-02-15 12:34:33
2	NICK	WAHLBERG	2006-02-15 12:34:33

创建一个actor_name表，将actor表中的所有first_name以及last_name导入改表。 actor_name表结构如下：

列表	类型	是否为NULL	含义
first_name	varchar(45)	not null	名字
last_name	varchar(45)	not null	姓氏

分析：从actor表中选出first_name和last_name这两列，创建为actor_name表

CREATE TABLE actor_name AS 
SELECT first_name, last_name FROM actor;

22. 查找薪水涨幅超过15次的员工号emp_no以及其对应的涨幅次数t

分析：理解题意，相同的emp_no，有一条记录，就算一次薪水涨幅变动

注意是COUNT(emp_no)，而不是COUNT(salary)

SELECT emp_no, COUNT(emp_no) t FROM salaries 
GROUP BY emp_no 
HAVING t > 15;

23. 从titles表获取按照title进行分组，每组个数大于等于2，给出title以及对应的数目t
注意对于重复的emp_no进行忽略

分析：注意与22题的区别：22题是按emp_no分组后，统计每组的个数

这题是按照title分组后，再按一定要求统计个数，即统计同一个title中不重复的emp_no的记录个数，所以用COUNT(DISTINCT emp_no)

SELECT title, COUNT(DISTINCT emp_no) t FROM titles
GROUP BY title
HAVING t>=2;

24. 构造一个触发器audit_log，在向employees_test表中插入一条数据的时候，触发插入相关的数据到audit中

CREATE TABLE employees_test(ID INT PRIMARY KEY NOT NULL, NAME TEXT NOT NULL, AGE INT NOT NULL, ADDRESS CHAR(50), SALARY REAL);
CREATE TABLE audit(EMP_no INT NOT NULL, NAME TEXT NOT NULL);

分析：用触发器同步两张表的数据更新

知识盲区：

构造触发器：CREATE TRIGGER 语句，用BEFORE或AFTER指定在执行后面的SQL语句之前或之后触发TRIGGER
BEFORE/AFTER [INSERT/UPDATE/ADD] ON 表名1
BEGIN和END语句之间：写触发器执行的内容，主要用分号‘;’
触发器中NEW关键字：触发事件之后对应的表名1的相关列的值；OLD关键字：触发事件之前对应的表名1的相关列的值

注意：这里是NEW.ID，ID是employees_test表中的列名，插入到audit中作为EMP_no的值

CREATE TRIGGER audit_log AFTER INSERT ON employees_test
BEGIN
    INSERT INTO audit VALUES(NEW.ID, NEW.NAME);
END;

25. 查找最晚入职员工的所有信息

分析：就是hire_date最大的对应的值，用个子查询语句实现

SELECT * FROM employees
WHERE hire_date=(
    SELECT max(hire_date) FROM employees);

26. 针对salaries表emp_no字段创建索引idx_emp_no，查询emp_no为10005, 使用强制索引

分析：知识盲区：

SQLite的强制索引查询：INDEXED BY 索引名;
MySQL的强制索引查询使用：FORCE INDEX(索引名);

SELECT * FROM salaries
INDEXED BY idx_emp_no
WHERE emp_no=10005;

27. 使用含有关键字exists查找未分配具体部门的员工的所有信息

分析：emp_no在employees表中, 但不在dept_emp表中

用NOT IN方法：

SELECT * FROM employees
WHERE emp_no NOT IN (SELECT emp_no FROM dept_emp)

知识盲区：EXIST语句

EXIST/ NOT EXIST返回：根据子查询语句的空或非空结果集返回一个BOOL值
外查询表的每一行都带入内查询表作为检验

此题，在 employees表中挑选出令(SELECT emp_no FROM dept_emp WHERE emp_no = employees.emp_no)不成立的记录
在employees表中逐条判断，有返回结果则为TRUE，否则为FALSE
比如employees表中的第一条emp_no=10001, 那么如果dept_emp表中，没有一条记录的emp_no=10001，那么就返回True，外表查询输出该条记录；
如果dept_emp表中，有一条记录的emp_no=10001，就返回False，外表查询不输出

SELECT * FROM employees
WHERE NOT EXISTS(SELECT emp_no FROM dept_emp WHERE emp_no=employees.emp_no)

应用场景：NOT EXIST语句防止重复插入

参考：http://blog.sina.com.cn/s/blog_5564eb640100i42t.html

从suppliers表中选取多条数据插入clients表(主键为client_id)中

INSERT INTO clients(client_id, client_name, client_type)
SELECT supplier_id, supplier_name, 'advertising' FROM suppliers
WHERE NOT EXISTS (SELECT * FROM clients
                  WHERE clients.client_id = suppliers.supplier_id);

插入单条数据到clients表(主键为client_id)中

INSERT INTO clients(client_id, client_name, client_type)
SELECT 10345, 'IBM', 'advertising' FROM dual
WHERE NOT EXISTS (SELECT * FROM clients
                  WHERE clients.client_id = 10345);

　　注意：这里使用虚拟表名dual，可在SELECT之后直接写需要插入的数据

28. 获取所有非manager的员工emp_no

分析：那就是emp_no在employees表中，不在dept_manager表中

注意：SQLite不支持MINUS，可以使用EXCEPT进行集合的差集运算

SELECT emp_no FROM employees
EXCEPT
SELECT emp_no FROM dept_manager;

SELECT结果集的列个数，对应的列种类必须相同

并集：[SQL语句1] UNION [SQL语句2] 去重
[SQL语句1] UNION ALL [SQL语句2] 不去重
交集：[SQL语句1] INTERSECT [SQL语句2]
差集：[SQL语句1] EXCEPT [SQL语句2]

用NOT IN方法：

SELECT emp_no FROM employees
WHERE emp_no NOT IN (SELECT emp_no FROM dept_manager)

用LEFT JOIN方法：注意有dept_manager.emp_no is NULL

SELECT a.emp_no FROM employees a
LEFT JOIN dept_manager b
ON a.emp_no=b.emp_no
WHERE b.emp_no is NULL

29. 获取当前（to_date='9999-01-01'）薪水第二多的员工的emp_no以及其对应的薪水salary

分析：可以用LIMIT 1,1选择第二多的记录，但要注意去重的情况，比如第一多的有重复两个，那么LIMIT 1,1选的还是薪水第一多的记录

原始SQL（没有考虑重复的情况）

SELECT emp_no, salary FROM salaries
WHERE to_date='9999-01-01'
ORDER BY salary DESC LIMIT 1,1

用DISTINCT去重：子查询中也增加了当前 to_date的限制

SELECT emp_no, salary FROM salaries
WHERE to_date='9999-01-01' AND salary=(SELECT DISTINCT(salary) FROM salaries
                                       WHERE to_date='9999-01-01'
                                       ORDER BY salary DESC LIMIT 1,1);

用GROUP BY去重：

SELECT emp_no,salary FROM salaries
WHERE to_date='9999-01-01'
GROUP BY salary
ORDER BY salary DESC LIMIT 1,1;

DISTINCT去重需要扫描全表，效率较低

30. 查找入职员工时间排名倒数第三的员工所有信息

分析：同29题，用DISTINCT去重+LIMIT使用

SELECT * FROM employees 
WHERE hire_date=(SELECT DISTINCT(hire_date) FROM employees
                 ORDER BY hire_date DESC LIMIT 2,1);

同样可以用GROUP BY去重：

SELECT * FROM employees 
WHERE hire_date
GROUP BY hire_date
ORDER BY hire_date DESC LIMIT 2,1;

posted @ 2020-04-08 23:36 Nooni 阅读(440) 评论(0) 收藏举报

刷新页面返回顶部

Nooni

牛客-SQL-刷题（上）

公告