700万数据随机取10条仅用不到10ms？

虽然有点唬人,但是在实际开发中,确实会遇到此类需求但是要求又不是很严格,那样的话用这个方式还是比较不错的选择

呵呵以下内容转载来自csdb论坛

blog文章
http://blog.csdn.net/jinjazz/archive/2009/04/16/4084142.aspx

SQL code

set nocount on
--75151448行数据
select count(*) from syscolumns a,syscolumns b,syscolumns c 
set statistics time on
 
 select top 10 * from(
select a.name as name,left(b.name,10) as name1, checksum(newid()) as hash
    from syscolumns a,syscolumns b,syscolumns c )t
 where hash%100=0
 
set statistics time off
set nocount off

SQL Server 执行时间:
CPU 时间 = 16 毫秒，占用时间 = 4 毫秒。
这么bt？不过仔细一看是唬人的，这个是伪随机，后面数百万的大部分数据是一辈子都不会有机会显示的。但这是一个思路，where hash%100=0 这句话当中的100是个关键的因素。
要做到真的随机，至少需要hash%700000，同样的机器需要20秒，不过个人觉得已经很不错了。如果是hash%70000则是2秒，可以看出这基本是个线性关系。此思路应该比order by newid更加实用吧，order by newid()的top 10 我在运行了2分半还没有反应后放弃了。

posted @ 2009-04-23 09:51 雨中漫步的太阳阅读(303) 评论(0) 编辑收藏举报

刷新页面返回顶部

700万数据随机取10条仅用不到10ms？

公告