700万数据随机取10条仅用不到10ms?
虽然有点唬人,但是在实际开发中,确实会遇到此类需求但是要求又不是很严格,那样的话用这个方式还是比较不错的选择
呵呵 以下内容转载 来自csdb论坛
blog文章
SQL Server 执行时间: CPU 时间 = 16 毫秒,占用时间 = 4 毫秒。 这么bt?不过仔细一看是唬人的,这个是伪随机,后面数百万的大部分数据是一辈子都不会有机会显示的。但这是一个思路,where hash%100=0 这句话当中的100是个关键的因素。 要做到真的随机,至少需要hash%700000,同样的机器需要20秒,不过个人觉得已经很不错了。如果是hash%70000则是2秒,可以看出这基本是个线性关系。此思路应该比order by newid更加实用吧,order by newid()的top 10 我在运行了2分半还没有反应后放弃了。 |