Mysql取随机数据效率测试(400W条中读取100条)
测试数据表的创建在文章:http://www.cnblogs.com/wt645631686/p/6868192.html
先看一下我的SQL方案
SELECT * FROM `emp` WHERE `empno` >=(SELECT FLOOR(RAND() * ((SELECT MAX(empno) FROM `emp`) - (SELECT MIN(empno) FROM `emp`)) + (SELECT MIN(empno) FROM `emp`))) LIMIT 100
在终端中测试结果是0.01sec.
在Mysql工具中测试结果是0.008-0.01sec。
看一下我在网上找到方案:
第一种方案:
SELECT *
FROM `emp` AS t1 JOIN (SELECT ROUND(RAND() * ((SELECT MAX(empno) FROM `emp`)-(SELECT MIN(empno) FROM `emp`))+
(SELECT MIN(empno) FROM `emp`)) AS empno) AS t2
WHERE t1.empno >= t2.empno
ORDER BY t1.empno LIMIT 100;
在终端中测试结果是0.00sec.
在Mysql工具中测试结果是0.001-0.003sec。
第二种方案:
SELECT * FROM `emp` WHERE empno >= (SELECT floor(RAND() * (SELECT MAX(empno) FROM `emp`))) ORDER BY empno LIMIT 100;
在终端中测试结果是0.01-0.02sec.
在Mysql工具中测试结果是0.014-0.016sec。
第三种方案:
SELECT * FROM `emp`
WHERE empno >= (SELECT floor( RAND() * ((SELECT MAX(empno) FROM `emp`)-(SELECT MIN(empno) FROM `emp`)) +
(SELECT MIN(empno) FROM `emp`)))
ORDER BY empno LIMIT 100;
在终端中多次测试,由0.2sec最高,到最终结果是0.10-0.14sec,这是因为Mysql的查询缓存起到了作用。
在Mysql工具中测试结果是0.125-0.289sec。
最终第一种方案胜出,得出结论:采用JOIN的语法比直接在WHERE中使用函数效率还要高很多。
具体原因大家自己用EXPLAIN或者DESC,PROFILING工具分析一下。