(大数据工程师学习路径)第四步 SQL基础课程----select详解

准备

在正式开始本内容之前,需要先从github下载相关代码,搭建好一个名为mysql_shiyan的数据库(有三张表:department,employee,project),并向其中插入数据。

具体操作如下,首先输入命令进入Desktop:

cd Desktop

然后再输入命令,下载代码:

git clone http://git.shiyanlou.com/shiyanlou/SQL4

下载完成后,输入“cd ~”(注意有空格)退回到原先目录,然后输入命令开启MySQL服务并使用root用户登录:

sudo service mysql start        #打开MySQL服务

mysql -u root                   #使用root用户登录

刚才从github下载的SQL4目录下,有个两文件“MySQL-04-01.sql”和“MySQL-04-02.sql”,其中第一个文件用于创建数据库,第二个文件向数据库中插入数据。

SQL4目录在桌面上,你可以用Gedit查看里面两个的文件。

输入命令运行第一个文件,搭建数据库:

source /home/shiyanlou/Desktop/SQL4/MySQL-04-01.sql

运行第二个文件,向数据库中插入数据:

source /home/shiyanlou/Desktop/SQL4/MySQL-04-02.sql

一、内容

在数据库操作语句中,使用最频繁,也被认为最重要的是SELECT查询语句。之前的实验中,我们已经在不少地方用到了 SELECT * FROM table_name; 这条语句用于查看一张表中的所有内容。 而SELECT与各种限制条件关键词搭配使用,具有各种丰富的功能,这次实验就进行详细介绍。

1、基本的SELECT语句

SELECT语句的基本格式为:

SELECT 要查询的列名 FROM 表名字 WHERE 限制条件;

如果要查询表的所有内容,则把要查询的列名用一个 * 号表示(实验2、3中都已经使用过),代表要查询表中所有的列。 而大多数情况,我们只需要查看某个表的指定的列,比如要查看employee表的name和age:

SELECT name,age FROM employee;

01

2、数学符号条件

SELECT语句常常会有WHERE限制条件,用于达到更加精确的查询。WHERE限制条件可以有数学符号 (=,<,>,>=,<=) ,刚才我们查询了name和age,现在稍作修改:

SELECT name,age FROM employee WHERE age>25;

筛选出age大于25的结果:

02

或者查找一个名字为Mary的员工:

SELECT name,age,phone FROM employee WHERE name='Mary';

结果当然是:

03

3、“AND”与“OR”

从这两个单词就能够理解它们的作用。WHERE后面可以有不止一条限制,而根据条件之间的逻辑关系,可以用OR(或)AND(且)连接:

SELECT name,age FROM employee WHERE age<25 OR age>30;     #筛选出age小于25,或age大于30

04

SELECT name,age FROM employee WHERE age>25 AND age<30;    #筛选出age大于25,且age小于30

05

而刚才的限制条件 age>25 AND age<30 ,如果需要包含25和30的话,可以替换为 age BETWEEN 25 AND 30 :

06

4、IN和NOT IN

关键词INNOT IN的作用和它们的名字一样明显,用于筛选“在”“不在”某个范围内的结果,比如说我们要查询在dpt3dpt4的人:

SELECT name,age,phone,in_dpt FROM employee WHERE in_dpt IN ('dpt3','dpt4');

07

NOT IN的效果则是,如下面这条命令,查询出了不在dpt1也不在dpt3的人:

SELECT name,age,phone,in_dpt FROM employee WHERE in_dpt NOT IN ('dpt1','dpt3');

08

5、通配符

关键字 LIKE 在SQL语句中和通配符一起使用,通配符代表未知字符。SQL中的通配符是 _ 和 % 。其中 _ 代表一个未指定字符,% 代表不定个未指定字符。

比如,要只记得电话号码前四位数为1101,而后两位忘记了,则可以用两个 _ 通配符代替:

SELECT name,age,phone FROM employee WHERE phone LIKE '1101__';

这样就查找出了1101开头的6位数电话号码

09

另一种情况,比如只记名字的首字母,又不知道名字长度,则用 % 通配符代替不定个字符:

SELECT name,age,phone FROM employee WHERE name LIKE 'J%';

这样就查找出了首字母为 J 的人:

10

6、对结果排序

为了使查询结果看起来更顺眼,我们可能需要对结果按某一列来排序,这就要用到 ORDER BY 排序关键词。默认情况下,ORDER BY的结果是升序排列,而使用关键词ASCDESC可指定升序降序排序。 比如,我们按salary降序排列,SQL语句为:

SELECT name,age,salary,phone FROM employee ORDER BY salary DESC;

11

7、SQL内置函数和计算

SQL允许对表中的数据进行计算。对此,SQL有5个内置函数,这些函数都对SELECT的结果做操作:

函数名:COUNTSUMAVGMAXMIN
作用: 计数 求和 求平均值 最大值 最小值

其中COUNT函数可用于任何数据类型(因为它只是计数),而另4个函数都只能对数字类数据类型做计算。

具体举例,比如计算出salary的最大、最小值,用这样的一条语句:

SELECT MAX(salary) AS max_salary,MIN(salary) FROM employee;

有一个细节你或许注意到了,使用AS关键词可以给值重命名,比如最大值被命名为了max_salary:

12

8、子查询

上面讨论的SELECT语句都仅涉及一个表中的数据,然而有时必须处理多个表才能获得所需的信息。例如:想要知道名为"Tom"的员工所在部门做了几个工程。员工信息储存在employee表中,但工程信息储存在project表中。 对于这样的情况,我们可以用子查询:

SELECT of_dpt,COUNT(proj_name) AS count_project FROM project
WHERE of_dpt IN
(SELECT in_dpt FROM employee WHERE name='Tom');

13

子查询还可以扩展到3层、4层或更多层。

9、连接查询

在处理多个表时,子查询只有在结果来自一个表时才有用。但如果需要显示两个表或多个表中的数据,这时就必须使用连接(join)操作。 连接的基本思想是把两个或多个表当作一个新的表来操作,如下:

SELECT id,name,people_num
FROM employee,department
WHERE employee.in_dpt = department.dpt_name
ORDER BY id;

这条语句查询出的是,各员工所在部门的人数,其中员工的id和name来自employee表,people_num来自department表:

14

另一个连接语句格式是使用JOIN ON语法,刚才的语句等同于:

SELECT id,name,people_num
FROM employee JOIN department
ON employee.in_dpt = department.dpt_name
ORDER BY id;

结果也与刚才的语句相同。

二、练习

1、使用连接查询的方式,查询出各员工所在部门的人数与工程数,工程数命名为count_project。(连接3个表,并使用COUNT内置函数)

代码如下:(SQL基础不好,研究了好大会儿呢,可能有些繁琐的地方,欢迎指正!):

 

结果:

posted @ 2015-08-16 16:25  爱看球的领带  阅读(1455)  评论(6编辑  收藏  举报