大量数据如何做分页处理

合集 - 开发与运维(100)

1.面试官：你能简单聊聊MyBatis执行流程2024-02-02 2.一文详解应用安全防护ESAPI2024-02-04 3.一个线程，从“生”到“死”经历的过程2024-02-05 4.KubeEdge v1.16.0 版本发布！10项新增特性2024-02-05 5.解密JavaChassis3：易扩展的多种注册中心支持2024-02-06 6.解析Sermant热插拔能力：服务运行时动态挂载JavaAgent和插件2024-02-08 7.想设计一个高并发的消息中间件前，先熟悉一下这些知识点2024-02-17 8.华为云GES助力九洲平台：探索确定性运维的新实践2024-02-17 9.0-overlay和underlay，这两种容器网络你分得清吗2024-02-18 10.教你用Rust实现Smpp协议2024-02-18 11.基于OpenTelemetry实现Java微服务调用链跟踪2024-02-19 12.揭开华为云ADN提高网络质量的秘密2024-02-19 13.详解网络知识：iptables规则2024-02-19 14.实例详解在Go中构建流数据pipeline2024-02-21 15.面试官让我讲讲MySQL三大核心日志实现原理2024-02-21 16.华为云帕鲁服务器-云耀云容器版，到底强在哪？2024-02-22 17.掌握云容器网络：何为ipvs2024-02-22 18.一文带你了解容器探针2024-02-23 19.教你如何判断Java代码中异步操作是否完成2024-02-26 20.深入解析Python并发编程的多线程和异步编程2024-02-27 21.教你如何用Keepalived和HAproxy配置高可用 Kubernetes 集群2024-02-28 22.容器化环境中，JVM最佳参数配置实践2024-02-29 23.关于Python中math 和 decimal 模块的解析与实践2024-02-29 24.运维一款月变更70+次的服务，是一种什么体验？2024-03-01 25.详解Python中sys模块的功能与应用2024-03-04 26.教你用Ubuntu快速搭建饥荒服务器2024-03-04 27.分享一个能让你的研发效率提升超过20%的工具2024-03-06 28.下一代积木式智能组装编排，集成开发效率10倍提升2024-03-06 29.如何基于容器网络流量指标进行弹性伸缩2024-03-06 30.Sermant运行流程学习笔记，速来抄作业2024-03-06 31.用几张图实战讲解MySQL主从复制2024-03-07 32.速存，详细罗列香橙派AIpro外设接口样例大全（附源码）2024-03-07 33.CCE集群VPC网络模式下几种访问场景2024-03-11 34.聊聊CWE 4.14 与 ISA/IEC 62443中，如何保障工业软件的安全性2024-03-12 35.20个Python random模块的代码示例2024-03-13 36.Java获取堆栈信息的3种方法2024-03-13 37.Prometheus多集群监控的3种方案，你选哪种？2024-03-14 38.手把手的使用Toolkit插件在诗情画意中完成AI诗朗诵2024-03-14 39.从基础到代码实战，带你进阶正则表达式的全方位应用2024-03-14 40.掌握Python库的Bokeh，就能让你的交互炫目可视化2024-03-15 41.从0带你设计与实现基于STM32的智慧农业管理系统2024-03-15 42.Python实践：基于Matplotlib实现某产品全年销量数据可视化2024-03-18 43.何为代码检查服务的门禁级检查2024-03-19 44.深入分析Java中的PriorityQueue底层实现与源码2024-03-19 45.如何在Docker容器启动时自动运行脚本2024-03-20 46.从静态到动态化，Python数据可视化中的Matplotlib和Seaborn2024-03-25 47.无人不识又无人不迷糊的this2024-03-26 48.保姆级教程：教你UniMRCP对接华为云ASR（Linux版）2024-03-26 49.华为云亮相KubeCon EU 2024，以持续开源创新开启智能时代2024-03-26 50.如何用Flask中的Blueprints构建大型Web应用2024-03-27 51.手把手带你用香橙派AIpro开发AI推理应用2024-03-27 52.保护主机安全，我来buff加成2024-03-28 53.探索华为云CCE敏捷版金融级高可用方案实践案例2024-03-28 54.Python数据库编程全指南SQLite和MySQL实践2024-03-28 55.标准库unsafe：带你突破golang中的类型限制2024-03-29 56.【重磅干货】大模型时代，开发者云上成长指南2024-03-29 57.探索Django REST框架构建强大的API2024-03-29 58.实例演示如何使用CCE XGPU虚拟化2024-04-01 59.浅谈JVM整体架构与调优参数2024-04-02 60.Redis开源协议调整，我们怎么办？2024-04-02 61.一文教你实战构建消息通知系统Django2024-04-02 62.kube-apiserver限流机制原理2024-04-07 63.详解Java Chassis 3与Spring Cloud的互操作2024-04-10

64.大量数据如何做分页处理2024-04-10

65.基于istio实现单集群地域故障转移2024-04-10 66.基于istio实现多集群流量治理2024-04-11 67.实例讲解昇腾 CANN YOLOV8 和 YOLOV9 适配2024-04-11 68.20个Python 正则表达式应用与技巧2024-04-12 69.详解K8s 镜像缓存管理kube-fledged2024-04-15 70.如何使用Plotly和Dash进行数据可视化2024-04-15 71.Python中两种网络编程方式：Socket和HTTP协议2024-04-16 72.教你解决CCE集群中容器出网2024-04-16 73.Spring开发：动态代理的艺术与实践2024-04-16 74.Python中2种常用数据可视化库：Bokeh和Altair2024-04-17 75.K8s集群nginx-ingress监控告警最佳实践2024-04-18 76.如何基于Django中的WebSockets和异步视图来实现实时通信功能2024-04-22 77.实践展示openEuler部署Kubernetes 1.29.4版本集群2024-04-22 78.根据Nginx Ingress指标对指定后端进行HPA2024-04-22 79.教你如何进行Prometheus 分片自动缩放2024-04-23 80.世界读书日 | 开发者必读书单重磅来袭，华为云DTSE专家天团力荐2024-04-23 81.认识一下JavaScrip中的元编程2024-04-23 82.一次故障演练，十分钟自动搞定?2024-04-25 83.实践探讨Python如何进行异常处理与日志记录2024-04-25 84.6个实例带你解读TinyVue 组件库跨框架技术2024-04-26 85.11个Python循环技巧2024-04-28 86.华为云FunctionGraph构建高可用系统的实践2024-04-28 87.从原始边列表到邻接矩阵Python实现图数据处理的完整指南2024-04-30 88.教你用Perl实现Smgp协议2024-05-06 89.Python文本统计与分析从基础到进阶2024-05-06 90.Sermant在异地多活场景下的实践2024-05-08 91.华为云开发者桌面全新发布CodeArts IDE for Python，极致优雅云原生开发体验2024-05-08 92.关于Java Chassis 3的契约优先（API First）开发2024-05-09 93.带你熟悉CCE集群增强型CPU管理策略enhanced-static2024-05-11 94.从XML配置角度理解Spring AOP2024-05-13 95.Java Chassis 3：接口维度负载均衡2024-05-13 96.Python函数与模块的精髓与高级特性2024-05-14 97.地理数据可视化的神奇组合：Python和Geopandas2024-05-15 98.openGemini v1.2.0版本正式发布，IoT 场景性能大幅提升！2024-05-15 99.聊聊MySQL是如何处理排序的2024-05-16 100.教你如何搞定springboot集成kafka2024-05-16

本文分享自华为云社区《应用中大量数据的分页处理》，作者：码乐。

简介

大批量数据的展示一直被视为一个必须要解决的问题。一个经典的思想就是分批展示和处理它们。

1 查询时外键的处理

如果在django model 中模型使用了外键，通过on_delete 来定义关联操作。

CASCADE： 级联操作。如果外键那条数据删除了，这条数据也将被删除
PROTECT： 受保护，只要这条数据引用了外键的那条数据，旧不能删除外键数据，如果强行删除，Django框架将报错
SET_NULL: 设置为空，如果外键数据被删除，本条数据设置为空，前提是 可以设置本条数据为空
SET_DEFAULT: 设置默认值，如果外键数据删除了，设置这个数据的值为默认，前提是有默认值
SET()函数: 如果外键那条数据被删除，那么将会获取SET函数的值作为外键的值。Set()函数可以接受可调用对象，可调用对象的返回值作为结果设置回去。
DO_NOTHING: 不采取任何行为，一切看数据库级别的行为。

数据库层面的约束：

    PESTRICT： 默认选项，如果要删除父表记录，如果子表有关联记录，则不允许删除
    NOACTION：同上，首先检测外键
    CASCADE： 父表delete,update时，子表关联操作 也进行 delete，update
    SET NULL：父表delete , update时，子表将关联记录外键字段设置为null，所以设计子表时不能 not null

这些外键的方法工具，可以帮助使用者处理多表关联查询任务。

1.1 如何在django中查询分页

在有分页查询的应用中，包括 LIMIT 和 OFFSET 的查询十分常见，而且几乎每个都会有一个 ORDER BY 子句。

如果使用索引排序的话将对性能优化十分有帮助，否则服务端需要做很多文件排序。

一个高频的问题是 offset 的值过大。如果查询类似 LIMIT 10000, 20，将会产生10020行，并将之前的10000行丢弃，这样的代价很高。

    select * from table order by id limit 10000, 20;

很简单，该语句的意思就是查询10000+20条记录，去掉前10000条，返回后20条。
无疑该查询能够实现分页，但10000这位置的值越大，查询性能就越低，因为MySQL需要扫描全部10000+20条记录。

假设所有的页使用相同的频次访问，这样的查询将平均扫描一半数据表。为了优化他们，你可以在分页视图中限制最多可访问的页数，或者让大批量的查询更有效。

当一个表中有很多符合查询条件的数据的时候，我们往往不需要把他们全部一次性取出来，那样对查询效率或者服务器性能来说都会是一个极大的挑战:例如最简单的商城，假设商城中有一万个数据，但我们在前端可能只会每次看到一页.

    select * from table where xxx="xxx" limit 10;

这表示查询符合条件的10个数据。

    select * from table where xxx="xxx" limit 10 offset 10;

这表示分页，查询符合条件的第11到20的数据。

或者通过指定最大id去查询

    select * from table where id > #max_id# order by id limit n;

该查询同样会返回后n条记录，却无需像方式1扫描前m条记录，但必须在每次查询时拿到上一次查询（上一页）的最大id（或最小id），是比较常用的方式。

当然该查询的问题也在于，如果最大id不是连续的，则我们不一定能拿到这个id，比如当前在第3页，需要查询第5页的数据，就不行了。

或者通过子查询，先筛选前10000个，找到最大id，然后选择剩余的20个符合要求的

    select * from table where id > (select id from table order by id limit m, 1) limit n;

该查询同样是通过子查询扫描字段id，因为它不需要进行表的关联，而是一个简单的比较，在不知道上一页最大id的情况下，是比较推荐的用法。

左右连接的方式本身性能可能更差。
还有如下子查询、连接表，加索引快速定位元组，然后再读取元组

    SELECT * FROM table WHERE id <= (SELECT id FROM table ORDER BY id DESC LIMIT (page-1)*pagesize ORDER BY id DESC LIMIT pagesize)

rest_framework 内建了分页的操作模块,让我们来应用到具体函数即可 employee/views.py

from rest_framework.pagination import PageNumberPagination
@api_view(['GET', 'POST']) 
@permission_classes([CustomPermission])
def blog_api_view(request):
    """"""
    if request.method == "GET":
        paginator = PageNumberPagination()
        # paginator.page_size = 1 setting we display only 1 item per page.
        paginator.page_size = 2
        task_objects = EmployeeSign.objects.all()
        result = paginator.paginate_queryset(task_objects, request)

如果不使用分页,将显示全部的消息在同一个页面

        serializer = TaskSerializer(result, many=True)
        return Response(serializer.data)

访问分页数据.默认接口http://127.0.0.1:2001/api/tasks/ 就是分页1

http://127.0.0.1:2001/api/tasks/?page=1  #2,3,4...

2 小结

再重复一次，在有分页查询的应用中，包括 LIMIT 和 OFFSET 的查询十分常见，而且几乎每个都会有一个 ORDER BY 子句。如果使用索引排序的话将对性能优化十分有帮助，否则服务端需要做很多文件排序。

一个高频的问题是 offset 的值过大。如果查询类似 LIMIT 10000, 20，将会产生10020行，并将之前的10000行丢弃，这样的代价很高。

假设所有的页使用相同的频次访问，这样的查询将平均扫描一半数据表。

为了优化他们，你可以在分页视图中限制最多可访问的页数，或者让大量的查询更有效。

点击关注，第一时间了解华为云新鲜技术~

posted @ 2024-04-10 09:23 华为云开发者联盟阅读(87) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 亿级数据量场景下，如何优化数据库分页查询方法？

· 3种分页列表缓存方式，速收藏~

· Django笔记三十四之分页操作

· JavaWeb分页显示内容之分页查询的三种思路(数据库分页查询)

· 【ⓂMySQL】数据量很大的情况下，对于分页查询你有什么优化方案吗？

阅读排行：
· 【.NET】调用本地 Deepseek 模型
· CSnakes vs Python.NET：高效嵌入与灵活互通的跨语言方案对比
· DeepSeek “源神”启动！「GitHub 热点速览」
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
· 我与微信审核的“相爱相杀”看个人小程序副业

历史上的今天：
2023-04-10 详解事务模式和Lua脚本，带你吃透Redis 事务
2023-04-10 大模型高效开发的秘密武器：大模型低参微调套件MindSpore PET
2023-04-10 浅析云原生时代的服务架构演进
2023-04-10 OpenTiny 跨端、跨框架组件库升级TypeScript，10万行代码重获新生

公告

昵称：华为云开发者联盟
园龄： 4年9个月
粉丝： 855
关注： 1

+加关注

2025年2月

日

一

二

三

四

五

六

大量数据如何做分页处理

简介

1 查询时外键的处理

1.1 如何在django中查询分页

2 小结

公告

搜索

常用链接

我的标签

积分与排名

合集 (21)

随笔分类 (4020)

随笔档案 (4101)

阅读排行榜

评论排行榜

推荐排行榜

最新评论