mysql连接用法总结
MySQL支持的连接类型如下:
交叉连接、内连接、外连接(左外连接和右外连接)、自连接、联合
在演示各种连接的用法之前,我们先定义如下的数据库表格,以后的演示就使用它们。
mysql> select * from t_users; +---------+-----------+---------+---------------------+ | iUserID | sUserName | iStatus | dtLastTime | +---------+-----------+---------+---------------------+ | 1 | baidu | 0 | 2010-06-27 15:04:03 | | 2 | google | 0 | 2010-06-27 15:04:03 | | 3 | yahoo | 0 | 2010-06-27 15:04:03 | | 4 | tencent | 0 | 2010-06-27 15:04:03 | +---------+-----------+---------+---------------------+
mysql> select * from t_groups; +----------+------------+---------------------+ | iGroupID | sGroupName | dtLastTime | +----------+------------+---------------------+ | 1 | spring | 2010-06-27 15:04:03 | | 2 | summer | 2010-06-27 15:04:03 | | 3 | autumn | 2010-06-27 15:04:03 | | 4 | winter | 2010-06-27 15:04:03 | +----------+------------+---------------------+
mysql> select * from t_users_groups; +---------+----------+---------------------+ | iUserID | iGroupID | dtLastTime | +---------+----------+---------------------+ | 1 | 1 | 2010-06-27 15:04:03 | | 2 | 1 | 2010-06-27 15:04:03 | | 4 | 3 | 2010-06-27 15:04:03 | | 6 | 4 | 2010-06-27 15:04:03 | +---------+----------+---------------------+
1.交叉连接
2.内连接
3.外连接
外连接有什么特点?简而言之,外连接作用在通过某个key相连接的两张表上,它首先从A表中依次读出每行数据,然后到与之相连接的B表,寻找具有相同key值的记录。如果有匹配行,A和B的对应记录组成新结果行;如果没有,A与一条各字段为NULL的B记录组成新结果行。
到底从哪个表中选择所有行,SQL标准定义了左外连接和右外连接。
左外连接: mysql> SELECT * FROM t_users LEFT JOIN t_users_groups ON t_users.iUserID=t_users_groups.iUserID; +---------+-----------+---------+---------------------+---------+----------+---------------------+ | iUserID | sUserName | iStatus | dtLastTime | iUserID | iGroupID | dtLastTime | +---------+-----------+---------+---------------------+---------+----------+---------------------+ | 1 | baidu | 0 | 2010-06-27 15:04:03 | 1 | 1 | 2010-06-27 15:04:03 | | 2 | google | 1 | 2010-06-27 15:46:51 | 2 | 1 | 2010-06-27 15:04:03 | | 3 | yahoo | 1 | 2010-06-27 15:46:51 | NULL | NULL | NULL | | 4 | tencent | 0 | 2010-06-27 15:04:03 | 4 | 3 | 2010-06-27 15:04:03 | +---------+-----------+---------+---------------------+---------+----------+---------------------+ 4 rows in set (0.00 sec)
t_users为上述描述中的A表,t_users_groups为B表。
右外连接: mysql> SELECT * FROM t_users RIGHT JOIN t_users_groups ON t_users.iUserID=t_users_groups.iUserID; +---------+-----------+---------+---------------------+---------+----------+---------------------+ | iUserID | sUserName | iStatus | dtLastTime | iUserID | iGroupID | dtLastTime | +---------+-----------+---------+---------------------+---------+----------+---------------------+ | 1 | baidu | 0 | 2010-06-27 15:04:03 | 1 | 1 | 2010-06-27 15:04:03 | | 2 | google | 1 | 2010-06-27 15:46:51 | 2 | 1 | 2010-06-27 15:04:03 | | 4 | tencent | 0 | 2010-06-27 15:04:03 | 4 | 3 | 2010-06-27 15:04:03 | | NULL | NULL | NULL | NULL | 6 | 4 | 2010-06-27 15:04:03 | +---------+-----------+---------+---------------------+---------+----------+---------------------+ 4 rows in set (0.00 sec)
t_users_groups为上述描述中的A表,t_users为B表。
4.自连接
5.联合
UNION运算符表示联合,它用来把多个SELECT查询的结果连接成一个单独的结果集,但在连接时去除重复行。可以使用UNION连接尽可能多的SELECT查询,但要谨记两个基本条件。首先,每个SELECT查询返回的字段个数必须相同。第二,每个SELECT查询的字段类型必须依次相同。
我们举个联合例子:
mysql> SELECT iUserID,sUserName,dtLastTime FROM t_users -> UNION -> SELECT iGroupID,sGroupName,dtLastTime FROM t_groups; +---------+-----------+---------------------+ | iUserID | sUserName | dtLastTime | +---------+-----------+---------------------+ | 1 | baidu | 2010-06-27 15:04:03 | | 2 | google | 2010-06-27 15:46:51 | | 3 | yahoo | 2010-06-27 15:46:51 | | 4 | tencent | 2010-06-27 15:04:03 | | 1 | spring | 2010-06-27 15:04:03 | | 2 | summer | 2010-06-27 15:04:03 | | 3 | autumn | 2010-06-27 15:04:03 | | 4 | winter | 2010-06-27 15:04:03 | +---------+-----------+---------------------+ 8 rows in set (0.01 sec)
对UNION的每个SELECT添加ORDER BY子句是没有意义的,如果要排序则必须将其施加到最后的结果集上。比如我们要对上面的例子中的iUserID进行排序,应该使用如下的SQL语句:
mysql> (SELECT iUserID,sUserName,dtLastTime FROM t_users) -> UNION -> (SELECT iGroupID,sGroupName,dtLastTime FROM t_groups) -> ORDER BY iUserID ASC; +---------+-----------+---------------------+ | iUserID | sUserName | dtLastTime | +---------+-----------+---------------------+ | 1 | baidu | 2010-06-27 15:04:03 | | 1 | spring | 2010-06-27 15:04:03 | | 2 | google | 2010-06-27 15:46:51 | | 2 | summer | 2010-06-27 15:04:03 | | 3 | yahoo | 2010-06-27 15:46:51 | | 3 | autumn | 2010-06-27 15:04:03 | | 4 | tencent | 2010-06-27 15:04:03 | | 4 | winter | 2010-06-27 15:04:03 | +---------+-----------+---------------------+ 8 rows in set (0.02 sec)
假设我们还有一个db_src.t_users,它与db_tar.t_users结构完全相同。现网的应用策略,要求先操作db_src.t_users,确认无误后再同步到db_tar.t_users。所以两边数据只会存在三种情况,后面我们将分别介绍如何使用SQL连接在数据库间增量同步数据。
mysql> select * from t_users; +---------+-----------+---------+---------------------+ | iUserID | sUserName | iStatus | dtLastTime | +---------+-----------+---------+---------------------+ | 1 | baidu | 0 | 2010-06-27 15:04:03 | | 2 | google | 1 | 2010-06-27 15:46:51 | | 3 | yahoo | 1 | 2010-06-27 15:46:51 | | 4 | tencent | 0 | 2010-06-27 15:04:03 | | 5 | netease | 0 | 2010-06-27 15:04:03 | +---------+-----------+---------+---------------------+ 5 rows in set (0.01 sec)
情况1:db_src.t_users存在某条记录,db_tar.t_users中不存在。策略->将前者中的记录插入到后者中。
解决该问题的SQL语句为:
INSERT INTO db_tar.t_users select db_src.t_users.* FROM db_src.t_users LEFT JOIN db_tar.t_users ON db_src.t_users.iUserID=db_tar.t_users.iUserID WHERE db_tar.t_users.iUserID IS NULL;
同步原理其实很简单,核心SQL语句就是SELECT db_src.t_users.iUserID, db_src.t_users.sUserName, db_tar.t_users.* FROM db_src.t_users LEFT JOIN db_tar.t_users ON db_src.t_users.iUserID=db_tar.t_users.iUserID WHERE db_tar.t_users.iUserID IS NULL。如果不使用where条件检索数据,执行SQL得到结果如下:
mysql> SELECT db_src.t_users.iUserID, db_src.t_users.sUserName, db_tar.t_users.* -> FROM db_src.t_users -> LEFT JOIN db_tar.t_users ON db_src.t_users.iUserID=db_tar.t_users.iUserID; +---------+-----------+---------+-----------+---------+---------------------+ | iUserID | sUserName | iUserID | sUserName | iStatus | dtLastTime | +---------+-----------+---------+-----------+---------+---------------------+ | 1 | baidu | 1 | baidu | 0 | 2010-06-27 15:04:03 | | 2 | google | 2 | google | 1 | 2010-06-27 15:46:51 | | 3 | yahoo | 3 | yahoo | 1 | 2010-06-27 15:46:51 | | 4 | tencent | 4 | tencent | 0 | 2010-06-27 15:04:03 | | 5 | netease | NULL | NULL | NULL | NULL | +---------+-----------+---------+-----------+---------+---------------------+ 5 rows in set (0.00 sec)
加入where语句后,我们就能得到"iUserID=5"这条记录不在目标数据表中,使用insert语句可以将其插入到目标数据库中,从而完成同步操作。
情况2:db_src.t_users存在某条记录,db_tar.t_users中也存在。策略->如果两者数据不同,则修改后者的记录。
这里有个问题,就是如何判断这两条记录是否不同。我们可以采用逐个字段比较的方法,但字段较多的时候就不好使用了。简单点的方法是规定修改db_src.t_users时,必须同时将db_src.t_users.dtLastTime修改为当前时间,以后就可以通过比较dtLastTime来判断数据是否不同。
根据上述判断方法,解决该问题的SQL语句为:
select CONCAT('UPDATE db_src.t_users SET ', 'iUserID=\'', db_src.t_users.iUserID, '\',', 'sUserName=\'', db_src.t_users.sUserName, '\',', 'iStatus=\'', db_src.t_users.iStatus, '\',', 'dtLastTime=\'', db_src.t_users.dtLastTime, '\' ', 'WHERE db_tar.t_users.iUserID=\'', db_src.t_users.iUserID, '\';') from db_src.t_users left join db_tar.t_users on db_src.t_users.iUserID = db_tar.t_users.iUserID where db_tar.t_users.iUserID is not null and db_src.t_users.dtLastTime > db_tar.t_users.dtLastTime;
直接执行上述语句得到只是一组UPDATE的SQL,并不能直接修改db_tar.t_users,我们可以在shell命令行上执行下面的这个命令完成同步功能:
mysql -Nse select CONCAT('UPDATE db_src.t_users SET ', 'iUserID=\'', db_src.t_users.iUserID, '\',', 'sUserName=\'', db_src.t_users.sUserName, '\',', 'iStatus=\'', db_src.t_users.iStatus, '\',', 'dtLastTime=\'', db_src.t_users.dtLastTime, '\' ', 'WHERE db_tar.t_users.iUserID=\'', db_src.t_users.iUserID, '\';') from db_src.t_users left join db_tar.t_users on db_src.t_users.iUserID = db_tar.t_users.iUserID where db_tar.t_users.iUserID is not null and db_src.t_users.dtLastTime > db_tar.t_users.dtLastTime; | mysql;
情况3:db_src.t_users不存在某条记录,但在db_tar.t_users中存在。策略->将该记录从后者中删除。
解决该问题的SQL语句为:
SELECT CONCAT('DELETE FROM db_tar.t_users WHERE db_tar.t_users.iUserID=', db_tar.t_users.iUserID, ';') FROM db_tar.t_users LEFT JOIN db_src.t_users ON db_src.t_users.iUserID=db_tar.t_users.iUserID WHERE db_src.t_users.iUserID IS NULL;
该SQL语句的情况和第二种情况相似,也不能直接执行。所以需要采用同样的方式使用SQL语句才能完成工作。可能已经有人看出了,还有更为简单的方法可以处理这种情况。对,确实存在!当然可以使用下面更为简洁的SQL语句:
DELETE FROM db_tar.t_users WHERE db_tar.t_users.UserID NOT IN (SELECT db_src.t_users.iUserID FROM db_src.t_users);