子查询在INSERT语句中的应用

在使用INSERT语句的时候,一般都是使用它向数据库中一条条的插入数据,比如:


INSERT INTO MyTable(FId,FName,FAge)VALUES(1,"John",20)

但是有时我们可能需要将数据批量插入表中,比如创建一个和T_ReaderFavorite表结构完全相同的表T_ReaderFavorite2,然后将T_ReaderFavorite 中的输入复制插入到T_ReaderFavorite2表。

首先我们创建T_ReaderFavorite2 表:


MYSQL,MSSQLServer,DB2:

CREATE TABLE T_ReaderFavorite2 (FCategoryId INT,FReaderId INT)

Oracle:

CREATE TABLE T_ReaderFavorite2 (FCategoryId NUMBER (10),FReaderId NUMBER (10))

按照普通的实现思路,我们需要编写如下的宿主语言代码:


rs = ExecuteQuery("SELECT * from T_ReaderFavorite");

while(rs.next())

{

    int categoryId = rs.get("FCategoryId");

    int readerId = rs.get("FReaderId");

    Execute("INSERT INTo T_ReaderFavorite2(FCategoryId,FReaderId) VALUES(?,?)",

    categoryId, readerId);

}

在宿主语言中逐条读取T_ReaderFavorite表中的记录,然后将它们逐条插入T_ReaderFavorite2表中。这样的处理方式能够正确的完成要求的功能,而且由于目前T_ReaderFavorite 表中的数据量非常少,所以这样处理速度上也没有什么影响。但是如果T_ReaderFavorite 表中有大量的数据的话,由于每插入一条数据都要执行两次数据库操作,所以这种处理方式效率非常低,因此必须采用其他的处理方式。

除了INSERT……VALUES……这种用法外,INSERT语句还支持另外一种语法,那就是INSERT……SELECT……,采用这种使用方式可以将SELECT语句返回的结果集直接插入到目标表中,因为这一切都是都数据库内部完成的,所以效率非常高。下面看一下使用INSERT……SELECT……来实现将T_ReaderFavorite中的输入复制插入到T_ReaderFavorite2表,SQL语句如下:


INSERT INTO T_ReaderFavorite2(FCategoryId,FReaderId)

SELECT FCategoryId,FReaderId FROM T_ReaderFavorite

这里使用SELECT FCategoryId,FReaderId FROM T_ReaderFavorite将T_ReaderFavorite表中的数据读出,然后使用INSERT INTO T_ReaderFavorite2(FCategoryId,FReaderId)将检索结果插入到T_ReaderFavorite2 表中,注意上下的列顺序必须是一一对应的。

执行完毕我们后我们查看T_ReaderFavorite2 表中的内容:


FCategoryId FReaderId

1 1

5 2

2 3

3 4

5 5

1 6

1 7

4 8

6 9

5 10

2 11

2 12

1 12

3 1

1 3

4 4

可以看到T_ReaderFavorite表中的数据已经被正确的复制到T_ReaderFavorite2 表中了。

使用INSERT……SELECT……不仅能够实现简单的将一个表中的数据导出到另外一个表中的功能,还能在将输入插入目标表之前对数据进行处理,比如下面的SQL 语句用于将T_ReaderFavorite表中的数据复制到T_ReaderFavorite2 表中,但是如果T_ReaderFavorite表中的FReaderId 列的值大于10,则将FReaderId 的值减去FCategoryId 的值后再复制到T_ReaderFavorite2 表中。编写如下的SQL语句:


INSERT INTO T_ReaderFavorite2(FCategoryId,FReaderId)

SELECT FCategoryId,(CASE WHEN FReaderId<=10 THEN FReaderId ELSE FReaderId- FCategoryId END) FROM T_ReaderFavorite

这里在SELECT 语句中使用CASE 函数来实现对数据插入前的处理。执行完毕我们后我们查看T_ReaderFavorite2 表中的内容:


FCategoryId FReaderId

1 1

5 2

2 3

3 4

5 5

1 6

1 7

4 8

6 9

5 10

2 9

2 10

1 11

3 1

1 3

4 4

使用这种插入前的数据处理可以完成诸如“将数据从A表导出到B表,并且将B表的主键全部加上bak前缀”、“将A公司的所有员工插入到我们的会员表,自动导入所有的客户信息,并且为其自动生成会员编号”等复杂的任务。

因为可以在插入目标表前可以对数据进行处理,所以INSERT……SELECT……语句不局限于同结构表间的数据插入,也可以实现异构表见输入的插入。假设要将所有会员爱好的图书统一增加“小说”,也就是为T_Reader 表中的每个读者都在T_ReaderFavorite表中创建一条FCategoryId等于1 的记录,实现SQL语句如下:


INSERT INTO T_ReaderFavorite(FCategoryId,FReaderId)

SELECT 1,FId FROM T_Reader

SELECT语句从T_Reader表中检索所有的读者信息,并且将第一列设定为固定值1,而将第二列设定为读者的主键,执行完毕查看T_ReaderFavorite表中的内容:


FCategoryId FReaderId

1 1

5 2

2 3

3 4

5 5

1 6

1 7

4 8

6 9

5 10

2 11

2 12

1 12

3 1

1 3

4 4

1 1

1 2

1 3

1 4

1 5

1 6

1 7

1 8

1 9

1 10

1 11

1 12

数据被正确的插入了,但是仔细查看T_ReaderFavorite表中的内容,不难发现其中有重复的数据,比如FCategoryId等于1、FReaderId等于1的记录出现了两次,这就出现了数据冗余,必须修改SQL语句防止这种情况的发生。也就是在将输入插入T_ReaderFavorite表之前要检查T_ReaderFavorite表中是否已经存在了同样的数据。

在继续进行之前请首先清空T_ReaderFavorite 表中的数据,然后执行开头的T_ReaderFavorite表数据的初始化代码。

首先需要在SELECT语句中添加WHERE子句,这个WHERE子句检查每个读者是否有Story的爱好,即是否存在图书分类主键为1的的爱好,只有没有的时候才返回记录:


SELECT 1,FId FROM T_Reader

WHERE NOT EXISTS

(

    SELECT * FROM T_ReaderFavorite

    WHERE T_ReaderFavorite. FCategoryId=1

    AND T_ReaderFavorite. FReaderId= T_Reader.FId

)

执行这个子查询片段,执行完毕我们就能在输出结果中看到下面的执行结果:


FId

1 2

1 4

1 5

1 8

1 9

1 10

1 11

可以看到检索出的确实是还没有以Story做为爱好的读者,所以编写下面的SQL语句来执行数据的插入:


INSERT INTO T_ReaderFavorite(FCategoryId,FReaderId)

SELECT 1,FId FROM T_Reader

WHERE NOT EXISTS

(

    SELECT * FROM T_ReaderFavorite

    WHERE T_ReaderFavorite. FCategoryId=1

    AND T_ReaderFavorite. FReaderId= T_Reader.FId

)

执行完毕查看T_ReaderFavorite表中的内容:


FCategoryId FReaderId

1 1

5 2

2 3

3 4

5 5

1 6

1 7

4 8

6 9

5 10

2 11

2 12

1 12

3 1

1 3

4 4

1 2

1 4

1 5

1 8

1 9

1 10

1 11

可以看到表中的数据没有重复的了,即使重复执行这个SQL 语句也都不会添加新的记录,因为这个SQL语句已经对数据的重复做了检查。

posted @ 2018-10-19 01:00  尐鱼儿  阅读(3551)  评论(0编辑  收藏  举报