大数据量数据分页查询优化方案

在实际场景中会遇到这样的一种情况：数据量很大，而且还要分页查询，如果数据量达到百万级别之后，性能会急剧下降，导致查询时间很长，甚至是超时。接下来我总结了两种常用的优化方案，仅供参考。但是需要注意的是有个前提：主键id是递增且数据有序。

1：使用子查询优化

这种方式先定位偏移位置的 id，然后往后查询，这种方式适用于 id 递增的情况。sql如下图所示：

1 SELECT
2     * 
3 FROM
4     orders_history 
5 WHERE
6     type = 8 
7     AND id >= ( SELECT id FROM orders_history WHERE type = 8 LIMIT 100000, 1 ) 
8     LIMIT 100;

2：使用id限定优化

这种方式假设数据表的id是连续递增的，则我们根据查询的页数和查询的记录数可以算出查询的id的范围，可以使用id between and 来查询。sql如下图所示：

1 SELECT
2     * 
3 FROM
4     orders_history 
5 WHERE
6     type = 2 
7     AND id BETWEEN 1000000 
8     AND 1000100 
9     LIMIT 100;

还可以有另外一种写法，sql如下图所示：

select * from orders_history where id >= 1000001 limit 100;

总结：这种查询方案的前提条件已经说过了，主键递增且数据有序。其实就是利用B+树的原理进行的，因为在Innodb存储引擎中，数据是通过B+树进行存储，叶子节点存储的是主键id，另外子查询中也用到了覆盖索引。一般查询条件排序条件为按照主键id递增，或者是递减，查询偏移起始位置是经过计算之后，带入到sql中的。如果数据量实在是太大了，如果达到千万级别的话，哈哈哈，我建议还是使用分库分表组件吧，比如Apache ShardingSphere、MyCat等开源组件。

posted @ 2021-01-06 17:45 郭慕荣阅读(1950) 评论(0) 编辑收藏举报

刷新页面返回顶部

郭慕荣博客园

大数据量数据分页查询优化方案

公告