mysql数据库多表查询及函数运算符（二）

一、单表查询的语法

SELECT 字段1,字段2... FROM 表名
                  WHERE 条件
                  GROUP BY field
                  HAVING 筛选
                  ORDER BY field
                  LIMIT 限制条数

二、关键字的执行优先级(重点)

重点中的重点：关键字的执行优先级
from
where
group by
having
select
distinct
order by
limit

1.找到表:from

2.拿着where指定的约束条件，去文件/表中取出一条条记录

3.将取出的一条条记录进行分组group by，如果没有group by，则整体作为一组

4.将分组的结果进行having过滤

5.执行select

6.去重

7.将结果按条件排序：order by

8.限制结果的显示条数

查询

给表起别名，用在SQL语句同时查询多张表，又不想写太多表名的情况下

select s.name, s.gender from students2 as s;

去重

select distinct gender from students2; # 只显示有多少种性别，而不是多少个性别

三、条件查询

比较运算> < = >= <= !=

 select * from students2 where age = 18; # 一个等号=就行

and

select name from students2 where age > 18 and gender="女";

条件：不在 18岁以上的女性这个范围内的信息

select * from students2 where not (age > 18 and gender="女");

易错

select * from students2 where not age > 18 and gender="女";

模糊查询like

　　% 替换一个或者多个

　　_ 替换一个

查询姓名中以“小”开始的名字

select name from students2 where name like "小%";

查询姓名中有“小”所有的名字

select name from students2 where name like "%小%";

查询有两个字的名字

select * from students2 where name like "__";

查询至少有两个字的名字

select * from students2 where name like "__%";

rlike 正则

查询以小开始的姓名

select name from students2 where name rlike "^小.*";

范围查询

in(1, 3, 8)表示在一个非连续的范围内

查询年龄为12， 18， 21的信息

select * from students2 where age in (12, 18, 21);

查询年龄不为12， 18， 21的信息

select * from students2 where age not in (12, 18, 21);

between ... and ... 表示在一个连续的范围内

查询年龄在12到18之间的信息

select * from students2 where age between 12 and 18;

查询年龄不在12到18之间的信息

select * from students2 where age not between 12 and 18;

不能加括号：

select * from students2 where age not (between 12 and 18);

空判断

判空 is null

判非空 is not null

排序

order by 字段

asc从小到大排列升序

desc从大到小排列降序

升序

select * from students2 where (age between 12 and 18) and gender=2 order by age;

省略asc，即原本是：

select * from students2 where (age between 12 and 18) and gender=2 order by age asc;

降序

select * from students2 where (age between 12 and 18) and gender=2 order by age desc;

order by 多个字段

按年龄降序排，然后再按id降序排

select * from students2 where age between 12 and 18 order by age desc, id desc;

四、聚合分组

聚合函数

count 总数

select count(*) from students2 where gender=2;

select count(*) as 女性人数 from students2 where gender=2;

max 最大值

select max(age) from students2;

min 最小值

sum 求和

select sum(age) from students2;

avg 平均值

select avg(age) from students2 where gender=2;

select 后面可以跟表达式

 select sum(age)/count(age) from students2 where gender=2;

round(123.23, 1) 四舍五入保留一位小数

select round(sum(age)/count(age), 1) from students2 where gender=2;

分组 group by和聚合函数一起使用

错误：

select * from students2  group by gender;

筛选的条件是每个分组唯一的标识

select gender from students2  group by gender;

计算每个分组里面的人数

select gender, count(*) from students2 group by gender;

count(*)是对分组结果的计算

显示每个分组里面人的名字

select gender, group_concat(name) from students2 group by gender;

计算女性的人数

select gender, count(gender) from students2 where gender=2 group by gender;

select gender, group_concat(name,"_",age," ",id) from students2 where gender=2 group by gender; # 用下划线和空格分开，否则会连在一起

强调

如果我们用unique的字段作为分组的依据，则每一条记录自成一组，这种分组没有意义
多条记录之间的某个字段值相同，该字段通常用来作为分组的依据

having 筛选分组

查询平均年龄超过18岁的性别，以及姓名

select gender, group_concat(name) from students2 group by gender having avg(age) > 18;

where 和 having的区别：1、where在group by前面，having在后面。2、where是对表进行条件判断，而having是对查询结果进行条件判断。

分页 limit

限制查询出来的个数

select * from students2 where gender=2 limit 2;

limit start, count

 select * from students2 limit 2, 5;

limit (第N页-1)+每页的个数, 每页的个数

错误：

不能填入表达式

select * from students2 limit (3-1)*2, 2;

limit要放在最后面

错误

select * from students limit 4, 2 order by age asc;

正确

select * from students2 order by age asc limit 4, 2;

连接查询

内连接，取交集

select .... from 表名 inner join 表名;

select * from students2 inner join classes;

但是上面那样只是把students2里每一条数据和classes里的全部数据做连接，没有加条件限制

用on进行条件限制

select * from students2 inner join classes on students2.cls_id = classes.id;

只显示某些字段

 select students2.*, classes.name from students2 inner join classes on students2.cls_id = classes.id;

给表起别名

select s.name, c.name from students2 as s inner join classes as c on s.cls_id = c.id;

五、多表连接

外连接并集

左连接，查询结果为两个表匹配到的数据，左表特有的数据，对于右表中不存在的数据用null填充

select * from students2 as s left join classes as c on s.cls_id = c.id;

right join一般用的少，只要把表互换，left join也可以达到同样效果

查询没有对应班级信息的学生

select * from students2 as s left join classes as c on s.cls_id = c.id having c.id is null;

自关联

例如把全国各省市县地区导入到同一张表中，查询山东省的所有市

select province.city from ares as province inner join ares as city on city.pid = province.aid having province.atitle = "山东省";

子查询

一个select里面嵌套另一个select

查询身高最高的女生的所有信息

 select * from students2 where high = (select max(high) from students2 where gender=2);

用这个办法解决刚刚查询省份的问题

select * from areas where pid = (select aid from areas where atitle = "河北省");

带EXISTS关键字的子查询

EXISTS关字键字表示存在。在使用EXISTS关键字时，内层查询语句不返回查询的记录。
而是返回一个真假值。True或False
当返回True时，外层查询语句将进行查询；当返回值为False时，外层查询语句不进行查询

#department表中存在dept_id=203，Ture
mysql> select * from employee
    ->     where exists
    ->         (select id from department where id=200);
+----+------------+--------+------+--------+
| id | name       | sex    | age  | dep_id |
+----+------------+--------+------+--------+
|  1 | egon       | male   |   18 |    200 |
|  2 | alex       | female |   48 |    201 |
|  3 | wupeiqi    | male   |   38 |    201 |
|  4 | yuanhao    | female |   28 |    202 |
|  5 | liwenzhou  | male   |   18 |    200 |
|  6 | jingliyang | female |   18 |    204 |
+----+------------+--------+------+--------+

#department表中存在dept_id=205，False
mysql> select * from employee
    ->     where exists
    ->         (select id from department where id=204);
Empty set (0.00 sec)

六、数据库设计

设计关系数据库时，遵从不同的规范要求，设计出合理的关系型数据库，这些不同的规范要求被称为不同的范式，各种范式呈递次规范，越高的范式数据库冗余越小。

目前关系数据库有六种范式：第一范式（1NF）、第二范式（2NF）、第三范式（3NF）、巴斯-科德范式（BCNF）、第四范式(4NF）和第五范式（5NF，又称完美范式）。满足最低要求的范式是第一范式（1NF）。在第一范式的基础上进一步满足更多规范要求的称为第二范式（2NF），其余范式以次类推。一般说来，数据库只需满足第三范式(3NF）就行了。

范式的包含关系。一个数据库设计如果符合第二范式，一定也符合第一范式。如果符合第三范式，一定也符合第二范式…

第一范式（1NF）：属性不可分

（****1NF是对属性的原子性约束，要求属性具有原子性，不可再分解）

name tel age

手机座机

Josh 13612345678 021－9876543 22

Wang 13988776655 010－1234567 21

很明显，tel这个属性还可以进行分解，分解成手机和座机这两个属性，不满足第一范式的数据库，不是关系数据库！所以，我们在任何关系数据库管理系统中，做不出这样的“表”来。

第二范式（2NF）：符合1NF，并且非主属性完全依赖于码。

（2NF通俗说是要有主键（主键可以有多个字段），其他部分依赖完全于主键，不能是一部分）

如果这都不能理解，只能看看如下科学的解释了：

一个候选码中的主属性也可能是好几个。如果一个主属性，它不能单独做为一个候选码，那么它也不能确定任何一个非主属性。给一个反例：我们考虑一个小学的教务管理系统，学生上课指定一个老师，一本教材，一个教室，一个时间，大家都上课去吧，没有问题。那么数据库怎么设计？（学生上课表）

学生课程老师老师职称教材教室上课时间

小明一年级语文（上）大宝副教授《小学语文1》 101 14：30

一个学生上一门课，一定在特定某个教室。所以有（学生，课程）－>教室

一个学生上一门课，一定是特定某个老师教。所以有（学生，课程）－>老师

一个学生上一门课，他老师的职称可以确定。所以有（学生，课程）－>老师职称

一个学生上一门课，一定是特定某个教材。所以有（学生，课程）－>教材

一个学生上一门课，一定在特定时间。所以有（学生，课程）－>上课时间

因此（学生，课程）是一个码。

然而，一个课程，一定指定了某个教材，一年级语文肯定用的是《小学语文1》，那么就有课程－>教材。（学生，课程）是个码，课程却决定了教材，这就叫做不完全依赖，或者说部分依赖。出现这样的情况，就不满足第二范式！有什么不好吗？你可以想想：

1、校长要新增加一门课程叫“微积分”，教材是《大学数学》，怎么办？学生还没选课，而学生又是主属性，主属性不能空，课程怎么记录呢，教材记到哪呢? ……郁闷了吧?(插入异常)

2、下学期没学生学一年级语文（上）了，学一年级语文（下）去了，那么表中将不存在一年级语文（上），也就没了《小学语文1》。这时候，校长问：一年级语文（上）用的什么教材啊？……郁闷了吧?(删除异常)

3、校长说：一年级语文（上）换教材，换成《大学语文》。有10000个学生选了这么课，改动好大啊！改累死了……郁闷了吧？（修改异常）

那应该怎么解决呢？投影分解，将一个表分解成两个或若干个表

学生课程老师老师职称教室上课时间

小明一年级语文（上）大宝副教授 101 14：30

学生上课表

课程教材

一年级语文（上）《小学语文1》

第三范式（3NF）：符合2NF，****并且，消除传递依赖。

（3NF是对字段冗余性的约束，即任何字段不能由其他字段派生出来，它要求字段没有冗余）

正如前面所说：没有数据冗余的数据库并不一定是最好的数据库，所以有没有冗余的设计，要综合来考虑。

上面的“学生上课表”符合2NF，可以这样验证：两个主属性单独使用，不用确定其它四个非主属性的任何一个。但是它有传递依赖！在“老师”和“老师职称”这里，一个老师一定能确定一个老师职称。

如果不消除这种传递依赖，有可能会出现：

1、老师升级了，变教授了，要改数据库，表中有N条，改了N次……（修改异常）

2、没人选这个老师的课了，老师的职称也没了记录……（删除异常）

3、新来一个老师，还没分配教什么课，他的职称记到哪？……（插入异常）

那应该怎么解决呢？和上面一样，投影分解：

学生课程老师教室上课时间

小明一年级语文（上）大宝 101 14：30

老师老师职称

大宝副教授

BCNF：符合3NF，****并且，主属性不依赖于主属性。

若关系模式属于第二范式，且每个属性都不传递依赖于键码，则R属于BC范式。

通常

BC范式的条件有多种等价的表述：每个非平凡依赖的左边必须包含键码；每个决定因素必须包含键码。

BC范式既检查非主属性，又检查主属性。当只检查非主属性时，就成了第三范式。满足BC范式的关系都必然满足第三范式。

还可以这么说：若一个关系达到了第三范式，并且它只有一个候选码，或者它的每个候选码都是单属性，则该关系自然达到BC范式。

一般，一个数据库设计符合3NF或BCNF就可以了。

第四范式：****要求把同一表内的多对多关系删除。

第五范式：从最终结构重新建立原始结构。

posted @ 2019-08-08 15:13 尤利阳阅读(157) 评论(0) 编辑收藏举报

刷新页面返回顶部

尤利阳

"To iterate is human, to recurse divine"

mysql数据库多表查询及函数运算符（二）

一、单表查询的语法

二、关键字的执行优先级(重点)

查询

去重

三、条件查询

比较运算> < = >= <= !=

模糊查询like

rlike 正则

范围查询

空判断

排序

order by 多个字段

四、聚合分组

聚合函数

分组 group by和聚合函数一起使用

having 筛选分组

五、多表连接

外连接并集

自关联

子查询

带EXISTS关键字的子查询

六、数据库设计

公告

尤利阳

"To iterate is human, to recurse divine"

mysql数据库多表查询及函数运算符（二）

一、单表查询的语法

二、关键字的执行优先级(重点)

查询

去重

三、条件查询

比较运算> < = >= <= !=

模糊查询like

rlike 正则

范围查询

空判断

排序

order by 多个字段

四、聚合分组

聚合函数

分组 group by和聚合函数一起使用

having 筛选分组

五、多表连接

外连接 并集

自关联

子查询

带EXISTS关键字的子查询

六、数据库设计

公告

外连接并集