MySQL__数据处理之查询
1—基本 SELECT 语句
*|{[DISTINCT] column|expression [alias],...}
table;
- SELECT 标识选择哪些列。
- FROM 标识从哪个表中选择。
选择全部列
departments;
选择特定的列
department_id, location_id
注 意
- SQL 语言大小写不敏感。
- SQL 可以写在一行或者多行
- 关键字不能被缩写也不能分行
- 各子句一般要分行写。
- 使用缩进提高语句的可读性。
列的别名
列的别名:
- 重命名一个列。
- 便于计算。
- 紧跟列名,也可以在列名和别名之间加入关键字 ‘AS’,别名使用双引号,以便在别名中包含空格或特殊的字符并区分大小写。
使用别名
SELECT last_name AS name, commission_pct comm
FROM employees;
字符串
- 字符串可以是 SELECT 列表中的一个字符,数字,日期。
- 日期和字符只能在单引号中出现。
- 每当返回一行时,字符串被输出一次。
显示表结构
使用 DESCRIBE 命令,表示表结构DESC[RIBE] tablename
DESCRIBE employees
2—过滤和排序数据
过滤
- 使用WHERE 子句,将不满足条件的行过滤掉。
SELECT *|{[DISTINCT] column|expression [alias],...}
FROM table
[WHERE condition(s)];
WHERE 子句紧随 FROM 子句。
在查询中过滤行
EMPLOYEES
返回在 90号部门工作的所有员工的信息
WHERE 子句
SELECT employee_id, last_name, job_id, department_id
FROM employees
WHERE department_id = 90 ;
比较运算
SELECT last_name, salary
FROM employees
WHERE salary<= 3000;
其它比较运算
BETWEEN
使用 BETWEEN 运算来显示在一个区间内的值
SELECT last_name, salary
FROM employees
WHERE salary BETWEEN 2500 AND 3500;
Lower limit Upper limit
IN
使用 IN运算显示列表中的值。
SELECT employee_id, last_name, salary, manager_id
FROM employees
WHERE manager_id IN (100, 101, 201);
LIKE
- 使用 LIKE 运算选择类似的值
- 选择条件可以包含字符或数字:
_% 代表零个或多个字符(任意个字符)。
_ 代表一个字符。
SELECT FROM WHERE
first_name employees
first_name LIKE 'S%';
LIKE
- ‘%’和‘-’可以同时使用。
SELECT last_name
FROM employees
WHERE last_name LIKE '_o%';
NULL
使用 IS (NOT) NULL 判断空值。
SELECT last_name, manager_id
FROM employees
WHERE manager_id IS NULL;
逻辑运算
操作符 |
含义 |
AND |
逻辑并 |
OR |
逻辑或 |
NOT |
逻辑否 |
AND
AND 要求并的关系为真。
SELECT employee_id, last_name, job_id, salary
FROM employees
OR
OR 要求或关系为真。
SELECT employee_id, last_name, job_id, salary
FROM employees
WHERE salary >= 10000
OR job_id LIKE '%MAN%';
NOT
SELECT last_name, job_id
FROM employees
WHERE job_id
NOT IN ('IT_PROG', 'ST_CLERK', 'SA_REP');
ORDER BY子句
- 使用 ORDER BY 子句排序
_ASC(ascend): 升序
_DESC(descend): 降序
- ORDER BY 子句在SELECT语句的结尾。
ORDER BY hire_date
降序排序
DESC
按别名排序
annsal
多个列排序
- 按照ORDER BY 列表的顺序排序。
SELECT last_name, department_id, salary
FROM employees
ORDER BY department_id, salary DESC;
- 可以使用不在SELECT 列表中的列排序。
3 — 分组函数
什么是分组函数
分组函数作用于一组数据,并对一组数据返回一个值。
EMPLOYEES
组函数类型
- AVG()
- COUNT()
- MAX()
- MIN()
- SUM()
组函数语法
SELECT [column,] group_function(column), ...
FROM table
[WHERE condition]
[GROUP BY column]
[ORDER BY column];
AVG(平均值)和SUM (合计)函数
可以对数值型数据使用AVG 和 SUM 函数。
SELECT AVG(salary), MAX(salary),
MIN(salary), SUM(salary)
FROM employees
WHERE job_id LIKE '%REP%';
MIN(最小值)和 MAX(最大值)函数
可以对任意数据类型的数据使用 MIN 和 MAX 函数。
SELECT MIN(hire_date), MAX(hire_date)
FROM employees;
COUNT(计数)函数
COUNT(*) 返回表中记录总数,适用于任意数据类型。
SELECT COUNT(*)
FROM employees
WHERE department_id = 50;
COUNT(计数)函数
COUNT(expr) 返回expr不为空的记录总数。
SELECT COUNT(commission_pct)
FROM employees
WHERE department_id = 50;
分组数据
EMPLOYEES
分组数据: GROUP BY 子句语法
可以使用GROUP BY子句将表中的数据分成若干组
SELECT column, group_function(column)
FROM table
[WHERE condition]
[GROUP BY group_by_expression]
[ORDER BY column];
明确:WHERE一定放在FROM后面
GROUP BY 子句
在SELECT 列表中所有未包含在组函数中的列都应该包含在 GROUP BY 子句中。
SELECT department_id, AVG(salary)
FROM employees
GROUP BY department_id ;
GROUP BY 子句
包含在GROUP BY 子句中的列不必包含在SELECT 列表中
SELECT AVG(salary)
FROM employees
GROUP BY department_id ;
使用多个列分组
在GROUP BY子句中包含多个列
SELECT department_id dept_id, job_id, SUM(salary)
FROM employees
GROUP BY department_id, job_id ;
非法使用组函数
• 不能在 WHERE 子句中使用组函数。
• 可以在 HAVING 子句中使用组函数。
SELECT department_id, AVG(salary)
FROM employees
WHERE AVG(salary) > 8000
GROUP BY department_id;
WHERE AVG(salary) > 8000
*
ERROR at line 3:
ORA-00934: group function is not allowed here
WHERE 子句中不能使用组函数
过滤分组
EMPLOYEES
过滤分组: HAVING 子句
使用 HAVING 过滤分组:
- 行已经被分组。
- 使用了组函数。
- 满足HAVING 子句中条件的分组将被显示。
SELECT FROM [WHERE [GROUP BY [HAVING [ORDER BY
column, group_function
table condition]
group_by_expression] group_condition] column];
HAVING 子句
SELECT department_id, MAX(salary)
FROM employees
GROUP BY department_id
HAVING MAX(salary)>10000 ;
4 — 多表查询
beauty表 boys表
- 如果想查询女神名称和对应男神名称,肿么办?
多表连接
语法:select name,boyName from beauty,boys;
beauty表 boys表
笛卡尔集的错误情况:
select count(*) from beauty;
假设输出12行
select count(*)from boys;
假设输出4行
最终结果:12*4=48行
笛卡尔集
笛卡尔集会在下面条件下产生:
- 省略连接条件连接条件无效所有表中的所有行互相连接为了避免笛卡尔集, 可以在 WHERE 加入有效的连接条件。
Mysql 连接
使用连接在多个表中查询数据。
SELECT table1.column, table2.column
FROM table1, table2
WHERE table1.column1 = table2.column2;
- 在 WHERE 子句中写入连接条件。
- 在表中有相同列时,在列名之前加上表名前缀
beauty表 boys表
多表连接
等值连接
SELECT beauty.id,NAME,boyname FROM beauty ,boys
WHERE beauty.`boyfriend_id`=boys.i
区分重复的列名
使用表名前缀在多个表中区分相同的列。
- 在不同表中具有相同列名的列可以用表的别名加以区分。
- 如果使用了表别名,则在select语句中需要使用表别名代替表名
- 表别名最多支持32个字符长度,但建议越少越好
表的别名
- 使用别名可以简化查询。
- 使用表名前缀可以提高执行效率。
SELECT bt.id,NAME,boyname
FROM beauty bt,boys b;
WHERE bt.`boyfriend_id`=b.id ;
连接多个表
EMPLOYEES
DEPARTMENTS
LOCATIONS
- 连接 n个表,至少需要 n-1个连接条件。 例如:连接
三个表,至少需要两个连接条件。
练习:查询出公司员工的 last_name, department_name, city
SQL99:使用ON 子句创建连接
- 自然连接中是以具有相同名字的列为连接条件的。
可以使用 ON 子句指定额外的连接条件。
- 这个连接条件是与其它条件分开的。
- ON 子句使语句具有更高的易读性。
Join连接
- 分类:内连接 [inner] join on外连接左外连接left [outer] join on右外连接 right [outer] join on
ON 子句
SELECT bt.id,NAME,boyname
FROM beauty bt
Inner join boys b
On bt.`boyfriend_id`=b.id ;
连接多个表
EMPLOYEES
DEPARTMENTS
LOCATIONS
- 连接 n个表,至少需要 n-1个连接条件。 例如:连接
三个表,至少需要两个连接条件。
练习:查询出公司员工的 last_name, department_name, city
使用 ON 子句创建多表连接
SELECT employee_id, city, department_name
FROM employees e
JOIN departments d
ON d.department_id = e.department_id
JOIN locations l
ON d.location_id = l.location_id;
JOIN ON JOIN ON
外连接
beauty表 boys表
John连接总结