SQL分批查询-UNION与UNION ALL 使用技巧
union和union all都用于合并sql结果集操作,不管sql语句是否相同,但是返回字段最好一样,若不一样,字段名称只会以第一个为准
这就要求sql语句拥有相同的列(数量及名称),相同的返回类型
首先说下区别:
union 查询结果不包含重复值,即若有重复只返回一个
union all 查询结果包含所有值,重复多少个都会全部返回
使用:使用多条件模糊(或者说筛选)查询方法较慢(数据量较大)可换用另一种精确(索引或某字段)定位但sql过长的情况下、或者where条件中in过长(一般查过1000个会报错)、或者sql语句过长的情况,可以考虑将其转化为多个sql合并的union
示例1:指定每个小条件的索引作为id值(对于各组条件并不是完全不同或可能有没写条件拆分到多个sql的情况),每个sql中限定查询的成品个数,然后合并多个这样的sql
如下php中sql查询代码组织:
$sql="";
foreach ($productUuidArray as $index => $productArray) { $editStatus = $productArray['edit']; $uuids = implode(",", $productArray['uuid']); if($uuids=="") { //无成品信息,直接跳过 continue; } $sql .= "SELECT $index AS id,COUNT(DISTINCT product_uuid) AS dis_number,MAX(create_time) AS dis_time FROM log_info WHERE customer_id=$customerId AND edit_status=$editStatus AND product_uuid IN (" . $uuids . ") UNION "; }
sql语句:
SELECT $index AS id,COUNT(DISTINCT product_uuid) AS dis_number,MAX(create_time) AS dis_time
FROM log_info
WHERE customer_id=$customerId
AND edit_status=$editStatus
AND product_uuid IN (" . $uuids . ")
UNION
SELECT $index AS id,COUNT(DISTINCT product_uuid) AS dis_number,MAX(create_time) AS dis_time
FROM log_info
WHERE customer_id=$customerId
AND edit_status=$editStatus
AND product_uuid IN (" . $uuids . ")
上述sql的条件为三个:customer_id、edit_status、product_uuid,其中关键在于product_uuid字段,若某一组customer_id与edit_status相同的sql中uuid个数多于1000个时,应拆分为另一sql,所以可能会将product_uuid拆分到两个或更多的sql,customer_id及edit_status相同、product_uuid不同的情况,这时使用相同的$index作为索引,之后对查询结果进行判断组织(相同id的结果集:count相加、dis_time取最大的那个)即可
此方法应注意合并后的sql长度,一般sql行数5000行以内是没有问题的,大于5000行的情况,则应分多次查询数据库。极限的情况可能是每个in里只有一个uuid,这样,每次查询最多uuid为5000/6近似==800(一般取700以内)个,所以,组织$productUuidArray时,可以每0~700个查询一次数据库
示例2:添加排序
针对分批查询的数据排序,不能在每个小sql中排序,但可以在最后集中排序,示例如下:
SELECT
pi.channel_id,
pi.column_id,
pg.edit_status,
pi.schema_id,
pi.uuid,
pi.play_start_time
FROM
product_info pi
INNER JOIN product_progress_info pg ON pi.uuid = pg.product_uuid
WHERE
pi.channel_id = 80
AND pi.column_id = 236
AND pg.edit_status = 1
AND pi.schema_id = 1
AND (
(
pi.play_start_time >= '2013-07-29 00:00:00'
AND pi.play_start_time <= '2013-07-29 23:59:59'
)
)
UNION
SELECT
pi.channel_id,
pi.column_id,
pg.edit_status,
pi.schema_id,
pi.uuid,
pi.play_start_time
FROM
product_info pi
INNER JOIN product_progress_info pg ON pi.uuid = pg.product_uuid
WHERE
pi.channel_id = 80
AND pi.column_id = 10465
AND pg.edit_status = 1
AND pi.schema_id = 1
AND pi.play_start_time >= '2013-07-29 00:00:00'
AND pi.play_start_time <= '2013-07-29 23:59:59'
ORDER BY
channel_id,
column_id,
edit_status,
schema_id,
play_start_time
注:1.使用union的子sql不能包含排序语句
2.排序的列名必须与第一个子sql的列名相同,保险起见,可以使用索引id,如上sql排序可写:ORDER BY 1,2,3,4,6 ASC
3.排序字段列名不能带上表的别名,如channel_id不能写作pi.channel_id