Django常用的QuerySet操作

 

在这里我根据是否支持链式调用分类进行介绍

1. 支持链式调用的接口

  • all

使用频率比较高,相当于SELECT * FROM table 语句,用于查询所有数据

  • filter

使用频率比较高,根据条件过滤数据,常用的条件基本上字段等于、不等于、大于、小于。当然,还有其他的,比如能修改成产生LIKE查询的:Model.objects.filter(content__contains="条件")。

  • exclude

与filter相反的逻辑

  • reverse

将QuerySet中的结果倒叙排列

  • distinct

用来进行去重查询,产生SELECT DISTINCT这样的SQL查询

  • none

返回的QuerySet

2. 不支持链式调用的接口

  • get

比如Post.objects.get(id=1)用于查询id为1的文章:如果存在,则直接返回对应的Post实例;如果不存在,则抛出DoesNotExist异常。所以一般情况下,要使用异常捕获处理

1 try:
2     post = Post.objects.get(id=1)
3 except Post.DoesNotExist:
4 #做异常情况处理
  • create

用来直接创建一个Model对象,比如post = Post.objects.create(title="一起学习")。

  • get_or_create

根据条件查找,如果没查找到,就调用create创建。

  • update_or_create

与get_or_create相同,只是用来做更新操作。

  • count

用于返回QuerySet有多少条记录,相当于SELECT COUNT(*) FROM table 。

  • latest

用于返回最新的一条记录,但要在Model的Meta中定义:get_latest_by= <用来排序的字段>。

  • earliest

同上,返回最早的一条记录

  • first

从当前QuerySet记录中获取第一条

  • last

同上,获取最后一条

  • exists

返回True或者False,在数据库层面执行SELECT (1) AS "a" FROM table LIMIT 1的查询,如果只是需要判断QuerySet是否有数据,用这个接口是最合适的方式。

不要用count或者len(queryset)这样的操作来判断是否存在。相反,如果可以预期接下来会用到QuerySet中的数据,可以考虑使用len(queryset)的方式来做判断,这样可以减少一次DB查询请求。

  • bulk_create

同create,用来批量创建记录

  • in_ bulk

批量查询,接收两个参数id_ list和filed_ name。可以通过Post.objects. in_ bulk([1, 2, 3])查询出id为1、2、3的数据,返回结果是字典类型,字典类型的key为查询条件。返回结果示例: {1: <Post 实例1>, 2: <Post实例2>,3:<Post实例3>}。

  • update

用来根据条件批量更新记录,比如: Post.objects.filter(owner__name='123').update(title='测试更新')。

  • delete

同update,这个接口是用来根据条件批量删除记录。需要注意的是,和delete都会触发Djiango的signal

  • values

当我们明确知道只需要返回某个字段的值,不需要Model实例时,用它,用法如下:

1 title_list = Post.objects.filter(category_id=1).values('title')

返回的结果包含dict的QuerySet,类似这样: <QuerySet [{'title' :xxx},]>

  • values_list

同values,但是直接返回的是包含tuple的QuerySet:

1 titles_list = Post.objects.filter(category=1).values_list('title')

返回结果类似: <QuerySet[("标题",)]>

如果只是一个字段的话,可以通过增加flat=True参数,便于我们后续 处理:

1 title_list = Post.objects.filter(category=1).values_list('title',flat=True)
2 for title in title__list:
3     print(title)

2.1进阶接口

除了上面介绍的常用接口外,还有其他用来提高性能的接口,在下面介绍。 在优化Django项目时,尤其要考虑这几种接口的用法。

  • defer

把不需要展示的字段做延迟加载。比如说,需要获取到文章中除正文外的其他字段,就可以通过posts = Post.objects.all() .defer('content'),这样拿到的记录中就不会包含content部分。但是当我们需要用到这个字段时,在使用时会去加载。代码:

1 posts = Post.objects.all().defer('content')
2 for post in posts:  #此时会执行数据库查询
3     print (post.content)  #此时会执行数据查询,获取到content

当不想加载某个过大的字段时(如text类型的字段),会使用defer,但是上面的演示代产生N+1的查询问题,在实际使用时千万要注意!

注意:上面的代码是个不太典型的 N+1查询的问题, 一般情况下 由外键查询产生的N+1问题比较多,即一条查询请求返回N条数据,当我们操作数据时,又会产生额外的请求。这就是N+1问题,所有的ORM框架都存在这样的问题。

  • only

同defer接口刚好相反, 如果只想获取到所有的title记录,就可以使用only,只获取title的内容,其他值在获取时会产生额外的查询。

这就是用来解决外键产生的N+1问题的方案。我们先来看看什么情况下会产生这个问题:

posts = Post.objects.all ()
for post in posts:  #产生数据库查询
    print (post.owner)  #产生额外的数据库查询

代码同上面类似,只是这里用的是owenr(是关联表)。它的解决方法就是用select_ related接口:

post = Post.objects.all() .select_related('category')
for post in posts: # 产生数据库查询,category数据也会一次性查询出来
    print (post.category)

当然,这个接口只能用来解决一对多的关联关系。对于多对多的关系,还得使用下面的接口。

针对多对多关系的数据,可以通过这个接口来避免N+1查询。比如,post和tag的关系可以通过这种方式来避免:

posts = Post.objects.all().prefetch_related('tag')
for post in posts:#产生两条查询语句,分别查询post和tag
    print(post.tag.al1())

3.常用的字段查询

  • contains

包含,用来进行相似查询

  • icontains

同contains,只是忽略大小写。

  • exact

精确匹配

  • iexact

同exact,忽略大小写。

  • in

指定某个集合,比如Post.objects.filter(id__in=[1, 2, 3])相当于SELECT FROM table WHERE IN (1, 2, 3);。

  • gt

大于某个值。比如:Post.objects.filter(id__gt=1)

注意:是__gt

  • gte

大于等于某个值。

  • lt

小于某个值。

  • lte

小于等于某个值。

  • startswith

以某个字符串开头,与contains类似,只是会产生LIKE '<关键词>%'这样的SQL。

  • istartswith

同startswith, 忽略大小写。

  • endswith

以某个字符串结尾

  • iendswith

同endswith,忽略大小写。

  • range

范围查询,多用于时间范围,如Post.objects.filter(created_time__range= ('2018-05-01','2018-06-01'))会产生这样的查询: SELECT .. . WHERE created_ time BETWEEN '2018-05-01' AND '2018-06-01' ;。

关于日期类的查询还有很多,比如date、year和month等,具体等需要时查文档即可。

这里你需要理解的是,Django之所以提供这么多的字段查询,其原因是通过ORM来操作数据库无法做到像SQL的条件查询那么灵活。

因此,这些查询条件都是用来匹配对应SQL语句的,这意味着,如果你知道某个查询在SQL中如何实现,可以对应来看Django提供的接口。

3.1 进阶查询

除了上面基础的查询语句外,Django还提供了其他封装,来满足更复杂的查询,比如 SELECT ... WHERE id = 1 OR id = 2 这样的查询,用上面的基础查询就无法满足。

  • F

F表达式常用来执行数据库层面的计算,从而避免出现竞争状态。比如需要处理每篇文章的访问量,假设存在post.pv这样的字段,当有用户访问时,我们对其加1:

post = Post.objects.get(id=1)
post.pv = post.pv+1
post.save()

这在多线程的情况下会出现问题,其执行逻辑是先获取到当前的pv值,然后将其加1后赋值给post .pv.最后保存。

如果多个线程同时执行了post = Post.objects.get(id=1),那么每个线程里的post .pv值都是一样的, 执行完加1和保存之后,相当于只执行了一个加1,而不是多个。

这时通过F表达式就可以方便地解决这个问题:

from ajango.ab. models import F
post = Post.objects.get(id=1)
post.pv = F('pv') + 1
post.save():

这种方式最终会产生类似这样的SQL语句: UPDATE table SET pv = pv +1 WHERE ID = 1。 它在数据库层面执行原子性操作。

  • Q

Q表达式就是用来解决前面提到的那个OR查询的,可以这么用:

from django.db.mode1s import Q
Post.objects.filter(Q(id=1) | Q(id=2))

或者进行AND查询:

Post.objects.filter(Q(id=1) & Q(id=2))
  • Count

用来做聚合查询,比如想要得到某个分类下有多少篇文章,简单的做法就是:

category = Category.objects.get(id=1)
posts_count = category.post_set.count()

但是如果想要把这个结果放到category上呢?通过category.post_count可以访问到:

from django.db.models import Count
categories = Category.objects.annotate(posts_count=Count('post'))
print(categories[0].posts_count)

这相当于给category动态增加了属性post_count,而这个属性的值来源于Count('post'),最后可以用int取整。

  • Sum

同Count类似,只是它是用来做合计的。比如想要统计所有数据字段的总和,可以这么做:

from django.db.models import Sum
Post.objects.all().aggregate(a=Sum('字段'))
#输出类似结果:{'a':487}为字典

python中对字典中键值对的获取:

for i in book:
    print(i)#键的获取
    print(book[i])#值的获取

上面演示了QuerySet的annotate和aggregate的用法,其中前者用来給QuerySet结果増加属性,后者只用来直接计算结果,这些聚合表达式都可以与它们结合使用。

除了Count和Sum外,还有Avg、Min和Max等表达式,均用来满足我们对SQL査洵的需求。

posted @ 2019-06-19 11:40  Edison、23  阅读(19586)  评论(0编辑  收藏  举报