PostgreSQL-随机查询N条记录
PostgreSQL-随机查询N条记录
前言
利用一条SQL语句从数据库Table表中随机获取N条记录,各数据库的SQL语句略有不同,如下:
目录
1. MySql
2. SQL Server
3. Access
4. Oracle
5. postgreSQL
1、MySql
Select * From TABLE Order By Rand() Limit N
以上代码效率不高,自己对1000条数据表随机取10条的测试结果为耗时0.125s,有网友推荐改为以下代码效率有大幅提高,耗时为0.005s,不过结果是随机从某个位置开始取N条记录,而不是随机取N条记录,略有差异。详细说明见mysql使用rand随机查询记录效率测试。
SELECT * FROM TABLE
a join (SELECT ROUND(RAND() * ((SELECT MAX(id) FROM TABLE
)-(SELECT MIN(id)FROM TABLE
))+(SELECT MIN(id) FROM TABLE
)) AS id) AS b WHERE a.id >= b.id ORDER BY a.id LIMIT N;
2、SQL Server
Select TOP N * From TABLE Order By NewID()
NewID()函数将创建一个 uniqueidentifier 类型的唯一值。
3、Access
Select TOP N * From TABLE Order By Rnd(ID)
Rnd(ID) 其中的ID是自动编号字段,可以利用其他任何数值来完成,比如用姓名字段(UserName)
Select TOP N * From TABLE Order BY Rnd(Len(UserName))
4、Oracle
1)dbms_random包
select * from (select * from Table order by dbms_random.value) where rownum < N;
注:dbms_random包需要手工安装,位于$ORACLE_HOME/rdbms/admin/dbmsrand.sql
dbms_random.value(100,200)
可以产生100到200范围的随机数
2)按概率抽取:
select * from Table sample(百分比);
例:
select * from Table sample(10);
取表Table中记录条数的10%条记录
3)sys_guid
select * from (select * from Table order by sys_guid()) where rownum<N;
5、postgreSQL
select * from Table order by random() limit N
参考资料
©哈尔滨商业大学 银河统计工作室
银河统计工作室成员由在校统计、计算机部分师生和企业数据数据分析师组成,维护和开发银河统计网和银河统计博客(技术文档)。专注于数据挖掘技术研究和运用,探索统计学、应用数学和IT技术有机结合,尝试大数据条件下新型统计学教学模式。