ORM性能优化

利用标准数据库优化技术
Django的QuerySets
- - 示例
  - 详解
利用数据库本身进行计算工作
如果需要就一次性取出你所需要的数据
减少数据库的连接数
ORM几种优化方法的使用

参考: https://www.cnblogs.com/maple-shaw/p/7581316.html

利用标准数据库优化技术

1. 索引，给关键的字段添加索引，性能能更上一层楼，如给表的关联字段，搜索频率高的字段加上索引等。Django建立实体的时候，支持给字段添加索引，具体参考Django.db.models.Field.db_index。按照经验，Django建立实体之前应该早想好表的结构，尽量想到后面的扩展性，避免后面的表的结构变得面目全非。

2. 使用适当字段类型，本来varchar就搞定的字段，就别要text类型，小细节别不关紧要，后头数据量一上去，愈来愈多的数据，小字段很可能是大问题。

Django的QuerySets

了解Django的QuerySets对象，对优化简单程序有至关重要的作用。QuerySets是有缓存的，一旦取出来，它就会在内存里呆上一段时间，尽量重用它。

示例

如: 
>>> entry = Entry.objects.get(id=1)
>>> entry.blog   # 博客实体第一次取出，是要访问数据库的
>>> entry.blog   # 第二次再用，那它就是缓存里的实体了，不再访问数据库

如: all()
>>> entry = Entry.objects.get(id=1)
>>> entry.authors.all()   # 第一次all函数会查询数据库
>>> entry.authors.all()   # 第二次all函数还会查询数据库

详解

1. all, count, exists是调用函数（需要连接数据库处理结果的），注意在模板template里的代码，模板里不允许括号，但如果使用此类的调用函数，一样去连接数据库的，能用缓存的数据就别连接到数据库去处理结果。还要注意的是，自定义的实体属性，如果调用函数的，记得自己加上缓存策略。

2. 利用好模板的with标签：
	模板中多次使用的变量，要用with标签，把它看成变量的缓存行为吧。

3. 使用QuerySets的iterator()： 　　
	通常QuerySets先调用iterator再缓存起来，当获取大量的实体列表而仅使用一次时，缓存行为会耗费宝贵的内存，这时iterator()能帮到你，iterator()只调用iterator而省 去了缓存步骤，显著减少内存占用率，具体参考相关文档。

利用数据库本身进行计算工作

1. 使用 filter and exclude 过滤不需要的记录，这两个是最常用语句，相当是SQL的where.

2. 同一实体里使用F()表达式过滤其他字段.

3. 使用annotate对数据库做聚合运算
	不要用python语言对以上类型数据过滤筛选，同样的结果，python处理复杂度要高，而且效率不高， 白白浪费内存.

4. 使用QuerySet.extra(), extra虽然扩展性不太好，但功能很强大，如果实体里需要需要增加额外属性，不得已时，通过extra来实现，也是个好办法.

5. 使用原生的SQL语句 如果发现Django的ORM已经实现不了你的需求，而extra也无济于事的时候，那就用原生SQL语句.

如果需要就一次性取出你所需要的数据

	单一动作（如：同一个页面）需要多次连接数据库时，最好一次性取出所有需要的数据，减少连接数据库次数。

　　此类需求推荐使用QuerySet.select_related() （主动连表）和 prefetch_related()（被动连表）

　　相反，别取出你不需要的东西，模版templates里往往只需要实体的某几个字段而不是全部，这时QuerySet.values() 和 values_list()，对你有用，它们只取你需要的字段，返回字典dict和列表list类型的东西，在模版里够用即可，这可减少内存损耗，提高性能

　　同样QuerySet.defer()和only()对提高性能也有很大的帮助，一个实体里可能有不少的字段，有些字段包含很多元数据，比如博客的正文，很多字符组成，Django获取实体时（取出实体过程中会进行一些python类型转换工作），我们可以延迟大量元数据字段的处理，只处理需要的关键字段，这时QuerySet.defer()就派上用场了，在函数里传入需要延时处理的字段即可；而only()和defer()是相反功能

　　使用QuerySet.count()代替len(queryset),虽然这两个处理得出的结果是一样的，但前者性能优秀很多。同理判断记录存在时，QuerySet.exists()比if queryset实在强得太多了

减少数据库的连接数

使用 QuerySet.update() 和 delete()，这两个函数是能批处理多条记录的，适当使用它们事半功倍；如果可以，别一条条数据去update delete处理。

对于一次性取出来的关联记录，获取外键的时候，直接取关联表的属性，而不是取关联属性，如：

entry.blog.id
优于
entry.blog__id


# 善于使用批量插入记录，如：
Entry.objects.bulk_create([
    Entry(headline="Python 3.0 Released"),
    Entry(headline="Python 3.1 Planned") ])
优于
Entry.objects.create(headline="Python 3.0 Released")
Entry.objects.create(headline="Python 3.1 Planned")
# 前者只连接一次数据库，而后者连接两次


# 还有相似的动作需要注意的，如：多对多的关系，
my_band.members.add(me, my_friend)
优于
my_band.members.add(me)
my_band.members.add(my_friend)

ORM几种优化方法的使用

1. 能使用values()拿到字典, 要优于 对象.属性   # classes:外键
all_students = models.Students.objects.all().values('name', 'classes__name') 
for i in all_students:
    print(i['name'], i['classes__name'])
    
2. select_related: 
    - 会进行主动连表 (同sql的left join, 一条语句实现), 
    - 参数: 外键或一对一字段
        
all_students = models.Students.objects.all().select_related('classes') 
for i in all_students:
    print(i.name, i.classes.name)
    
3. prefetch_related: 
    - 子查询
    - 参数: 外键、一对一、多对多字段
        
all_students = models.Students.objects.all().prefetch_related('classes') 
for i in all_students:
    print(i.name, i.classes.name)
    
4. only: 
    - 作用: 只查询所需要的字段(拿到的是对象),不会查询额外的字段, 只做一次查询, 减少了查询的次数
    - 参数: 添加你要查询的字段

all_students = models.Students.objects.all().only('name') 
for i in all_students:
    print(i.name)   # 只拿到 name 字段
    
5. defer: 
    - 作用: 排除掉多余的字段(拿到的是对象)
    - 参数: 添加要排除的字段
        
all_students = models.Students.objects.all().defer('name') 
for i in all_students:
    print(i)        # 拿到除了 name 的其他字段

posted @ 2019-07-10 08:57 言值阅读(193) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

言值

ORM性能优化

利用标准数据库优化技术

Django的QuerySets

示例

详解

利用数据库本身进行计算工作

如果需要就一次性取出你所需要的数据

减少数据库的连接数

ORM几种优化方法的使用

公告