Django_ORM操作 - 查询
ORM 操作
必知必会13条
<1> all(): 查询所有结果 <2> filter(**kwargs): 它包含了与所给筛选条件相匹配的对象 <3> get(**kwargs): 返回与所给筛选条件相匹配的对象 返回结果有且只有一个,如果符合筛选条件的对象超过一个或者没有都会抛出错误。 <4> exclude(**kwargs): 它包含了与所给筛选条件不匹配的对象 <5> values(*field): 返回一个ValueQuerySet, 运行后得到的不是一系列model的实例化对象,而是一个可迭代的字典序列 <6> values_list(*field): 它与values()非常相似,它返回的是一个元组序列,values返回的是一个字典序列 <7> order_by(*field): 对查询结果排序 <8> reverse(): 对查询结果反向排序,请注意reverse()通常只能在具有已定义顺序的QuerySet上调用 (在model类的Meta中指定ordering或调用order_by()方法)。 <9> distinct(): 从返回结果中剔除重复纪录 (如果你查询跨越多个表,可能在计算QuerySet时得到重复的结果此时可以使用distinct(), 注意只有在PostgreSQL中支持按字段去重。) <10> count(): 返回数据库中匹配查询(QuerySet)的对象数量。 <11> first(): 返回第一条记录 .all().first 等效于 .first() <12> last(): 返回最后一条记录 <13> exists(): 如果QuerySet包含数据,就返回True,否则返回False
返回QuerySet对象的方法有
all() filter() exclude() order_by() reverse() distinct()
特殊的QuerySet
values() 返回一个可迭代的字典序列 values_list() 返回一个可迭代的元祖序列
具体的对象是无法使用这两个方法的 原理上来说models.py 里面的 class类 中就没有 这两个属性 这两个属性只针对于一个QuerySet序列集进行筛选才可以使用 比如 .filter(id=1) 虽然只返回了一个QuerySet对象 但是也可以使用
返回具体对象的
get() first() last()
对象可以直接 .属性 的方法去取值 原理上来说在数据库对象的里面就有属性自然是可以知己调用的
返回布尔值的方法
exists()
返回数字的方法有
count()
对象和QuerySet对象的区别
具体对象
- 可以直接 .属性 的方法去取值
- 本质上来说具体对象就是 models.py 里面的 class类的实例化,本身就有属性可以自己调用
- 无法使用values()和values_list()的, 因为自己的属性里面就没有
- 没有 .update() 方法, 在QuerySet对象才可以调用
QuerySet对象
- 可以调用values()和values_list()
- 这两个属性只针对于一个QuerySet序列集进行筛选才可以使用
- 比如 .filter(id=1) 虽然只返回了一个QuerySet对象 但是也可以使用
转换
QuerySet对象------>具体对象
QuerySet对象.first()
QuerySet对象[0]
# 查询 "部门表" 的全部内容 # 查询的时候不带 values或者values_list 默认就是查询 all() ret = models.Employee.objects.all() # """ # SELECT `employee`.`id`, `employee`.`name`, `employee`.`age`, `employee`.`salary`, `employee`.`province`, `employee`.`dept` FROM `employee` LIMIT 21; args=() # """ # 查询所有人的 "部门" 和 "年龄" # values 或者 values_list 里面写什么就相当于 select 什么字段 ret = models.Employee.objects.all().values("dept", "age") # """ # SELECT `employee`.`dept`, `employee`.`age` FROM `employee` LIMIT 21; args=() # """
单表查询之神奇的双下划线
models.Tb1.objects.filter(id__lt=10, id__gt=1) # 获取id大于1 且 小于10的值 models.Tb1.objects.filter(id__in=[11, 22, 33]) # 获取id等于11、22、33的数据 models.Tb1.objects.exclude(id__in=[11, 22, 33]) # not in models.Tb1.objects.filter(name__contains="ven") # 获取name字段包含"ven"的 models.Tb1.objects.filter(name__icontains="ven") # icontains大小写不敏感 models.Tb1.objects.filter(id__range=[1, 3]) # id范围是1到3的,等价于SQL的bettwen and 左右都包含 # 类似的还有:startswith,istartswith, endswith, iendswith # date字段还可以单独将年月日拿出来 models.Class.objects.filter(birtday__year=2017) models.Class.objects.filter(birtday__month=7) models.Class.objects.filter(birtday__day=17)
基础查询操作
基于对象关联查询
一对多查询(Book--Publish)
正向查询,按字段
book_obj.publish : 与这本书关联的出版社对象
book_obj.publish.addr: 与这本书关联的出版社的地址
反向查询,按表名_set
publish_obj.book_set: 与这个出版社关联的书籍对象集合
publish_obj.book_set.all() :[obj1,obj2,....]
一对一查询(Author---AuthorDetail)
正向查询,按字段
author_obj.ad : 与这个作者关联的作者详细信息对象
反向查询:按表名
author_detail_obj.author : 与这个作者详细对象关联的作者对象
多对多(Book----Author)
正向查询,按字段
book_obj.authorList.all(): 与这本书关联的所有这作者对象的集合 [obj1,obj2,....] book_obj.authorList.all().values("name"): 如果想查单个值的时候可以这样查
反向查询,按表名_set
author_obj.book_set.all() : 与这个作者关联的所有书籍对象的集合 book_obj.book_set.all().values("name"): 如果想查单个值的时候可以这样查
基于双下滑线的跨表查询(queryset对象查询)
一对多查询(Book--Publish)
正向查询,按字段
# 查询linux这本书的出版社的名字: models.Book.objects.all().filter(title="linux").values("publish__name")
反向查询:按表名
# 查询人民出版社出版过的所有书籍的名字 models.Publish.objects.filter(name="人民出版社出版").values("book__title")
一对一查询(Author---AuthorDetail)
正向查询,按字段
#查询egon的手机号 models.Author.objects.filter(name="egon").values("ad__tel")
反向查询:按表名
#查询手机号是151的作者 models.AuthorDetail.objects.filter(tel="151").values("author__name")
多对多(Book----Author)
正向查询,按字段
#查询python这本书的作者的名字 models.Book.objects.filter(title="python").values("authorList__name") [{},{},{},{}]
反向查询,按表名
#查询alex出版过的出的价格 models.Author.objects.filter(name="alex").values("book__price")
ps:
如果哟有设置,反向查询的时候都用:related_name 的值
publish=models.ForeignKey("Publish",related_name="bookList") authorlist=models.ManyToManyField("Author",related_name="bookList") ad=models.models.OneToOneField("AuthorDetail",related_name="authorInfo")
ManyToManyField
概念原理
利用 关联管理器 进行维护
-
- 外键关系的反向查询
- 多对多关联关系
create()
创建一个新的对象,保存对象,并将它添加到关联对象集之中,返回新创建的对象。
models.Author.objects.first().book_set.create(title="羊驼之歌", publish_id=2)
add()
把指定的model对象添加到关联对象集中。
添加对象 >>> author_objs = models.Author.objects.filter(id__lt=3) >>> models.Book.objects.first().authors.add(*author_objs)
添加id >>> models.Book.objects.first().authors.add(*[1, 2])
set()
更新model对象的关联对象。
book_obj = models.Book.objects.first() book_obj.authors.set([2, 3])
remove()
从关联对象集中移除执行的model对象
book_obj = models.Book.objects.first() author_obj.books.remove(book_obj) author_obj.books.remove(8) # 把id = 8 的书删掉
clear()
从关联对象移除一切对象。
book_obj = models.Book.objects.first() book_obj.authors.clear()
注意:
对于ForeignKey对象,clear()和remove()方法仅在null=True时存在。
# ForeignKey字段没设置null=True时, class Book(models.Model): title = models.CharField(max_length=32) publisher = models.ForeignKey(to=Publisher) # 没有clear()和remove()方法: >>> models.Publisher.objects.first().book_set.clear() Traceback (most recent call last): File "<input>", line 1, in <module> AttributeError: 'RelatedManager' object has no attribute 'clear' # 当ForeignKey字段设置null=True时, class Book(models.Model): name = models.CharField(max_length=32) publisher = models.ForeignKey(to=Class, null=True) # 此时就有clear()和remove()方法: dels.Publisher.objects.first().book_set.clear()
注意
对于所有类型的关联字段,add()、create()、remove() 和 clear(), set() 都会马上更新数据库。
换句话说,在关联的任何一端,都不需要再调用save()方法。
基于对象以及 queryset 对象的综合查询示例
1 from django.shortcuts import render,HttpResponse 2 3 # Create your views here. 4 5 6 from app01 import models 7 8 def query(request): 9 10 # #####################基于对象查询(子查询)############################## 11 # 按字段(publish) 12 # 一对多 book -----------------> publish 13 # <---------------- 14 # book_set.all() 15 16 # 正向查询按字段: 17 18 # 查询python这本书籍的出版社的邮箱 19 20 # python=models.Book.objects.filter(title="python").first() 21 # print(python.publish.email) 22 23 24 # 反向查询按 表名小写_set.all() 25 26 # 苹果出版社出版的书籍名称 27 28 # publish_obj=models.Publish.objects.filter(name="苹果出版社").first() 29 # for obj in publish_obj.book_set.all(): 30 # print(obj.title) 31 32 # 按字段(authors.all()) 33 # 多对多 book -----------------------> author 34 # <---------------- 35 # book_set.all() 36 37 38 # 查询python作者的年龄 39 # python = models.Book.objects.filter(title="python").first() 40 # for author in python.authors.all(): 41 # print(author.name ,author.age) 42 43 # 查询alex出版过的书籍名称 44 45 # alex=models.Author.objects.filter(name="alex").first() 46 # for book in alex.book_set.all(): 47 # print(book.title) 48 49 # 按字段 authorDetail 50 # 一对一 author -----------------------> authordetail 51 # <---------------- 52 # 按表名 author 53 54 55 #查询alex的手机号 56 # alex=models.Author.objects.filter(name='alex').first() 57 # print(alex.authorDetail.telephone) 58 59 60 # 查询家在山东的作者名字 61 62 # ad_list=models.AuthorDetail.objects.filter(addr="shandong") 63 # 64 # for ad in ad_list: 65 # print(ad.author.name) 66 67 68 69 ''' 70 对应sql: 71 72 select publish_id from Book where title="python" 73 select email from Publish where nid = 1 74 75 76 ''' 77 78 79 80 81 # #####################基于queryset和__查询(join查询)############################ 82 83 # 正向查询:按字段 反向查询:表名小写 84 85 86 # 查询python这本书籍的出版社的邮箱 87 # ret=models.Book.objects.filter(title="python").values("publish__email") 88 # print(ret.query) 89 90 ''' 91 select publish.email from Book 92 left join Publish on book.publish_id=publish.nid 93 where book.title="python" 94 ''' 95 96 # 苹果出版社出版的书籍名称 97 # 方式1: 98 ret1=models.Publish.objects.filter(name="苹果出版社").values("book__title") 99 print("111111111====>",ret1.query) 100 #方式2: 101 ret2=models.Book.objects.filter(publish__name="苹果出版社").values("title") 102 print("2222222222====>", ret2.query) 103 104 #查询alex的手机号 105 # 方式1: 106 ret=models.Author.objects.filter(name="alex").values("authorDetail__telephone") 107 108 # 方式2: 109 models.AuthorDetail.objects.filter(author__name="alex").values("telephone") 110 111 # 查询手机号以151开头的作者出版过的书籍名称以及书籍对应的出版社名称 112 113 ret=models.Book.objects.filter(authors__authorDetail__telephone__startswith="151").values('title',"publish__name") 114 print(ret.query) 115 116 117 return HttpResponse("OK")
queryset对象特性及优化
特性:
惰性执行
books = BookInfo.objects.all() # 此时,数据库并不会进行实际查询 # 只有当真正使用时,如遍历的时候,才会真正去数据库进行查询 for b in books: print(b)
缓存
# 进行数据库实际查询遍历,保存结果到bs,会进行数据库实际交互 bs = [b.id for b in BookInfo.objects.all()] # 再次调用缓存结果bs,不再进行数据库查询,而是使用缓存结果
优化方法:
exists()
简单的使用if语句进行判断也会完全执行整个queryset并且把数据放入cache,虽然你并不需要这些数据!为了避免这个,可以用exists()方法来检查是否有数据:
if queryResult.exists(): #SELECT (1) AS "a" FROM "blog_article" LIMIT 1; args=() print("exists...")
iterator()
当queryset非常巨大时,cache会成为问题。
处理成千上万的记录时,巨大的queryset可能会锁住系统进程,让你的程序濒临崩溃。
要避免在遍历数据的同时产生queryset cache,可以使用 iterator() 方法 来获取数据,处理完数据就将其丢弃
objs = Book.objects.all().iterator() # iterator()可以一次只从数据库获取少量数据,这样可以节省内存 for obj in objs: print(obj.title) # 基于迭代器的特性,被遍历到底部之后下次在使用是无效的了。 for obj in objs: print(obj.title)
使用 .iterator() 来防止生成cache,意味着遍历同一个queryset时会重复执行查询.
所以使 用 .iterator() 时需确保操作一个大queryset时没有重复执行查询.
总结:
Queryset的cache是用于减少程序对数据库的查询,在通常的使用下会保证只有在需要的时候才会查询数据库。
使用exists()和iterator()方法可以优化程序对内存的使用。不过,由于它们并不会生成queryset cache,可能 会造成额外的数据库查询。
聚合
导入
from django.db.models import Avg, Sum, Max, Min, Count
示例
>>> from django.db.models import Avg, Sum, Max, Min, Count >>> models.Book.objects.all().aggregate(Avg("price")) {'price__avg': 13.233333}
# 指定名称 >>> models.Book.objects.aggregate(average_price=Avg('price')) {'average_price': 13.233333} # 多次聚合 >>> models.Book.objects.all().aggregate(Avg("price"), Max("price"), Min("price")) {'price__avg': 13.233333, 'price__max': Decimal('19.90'), 'price__min': Decimal('9.90')}
注意:
aggregate 返回的是一个字典,而不是queryset 对象
分组
命令
Employee.objects.values("dept").annotate(avg=Avg("salary").values(dept, "avg")
示例
# 每个 “省” 的 “平均工资” , 查询后的结果为 “省 : 平均工资 ” # annotate前面是什么就按照什么来分组,annotate后面的字段是被分组后被计算的新增数据列, ret = models.Employee.objects.values("province").annotate(a=Avg("salary")).values("province", "a") # """ # SELECT `employee`.`province`, AVG(`employee`.`salary`) AS `a` FROM `employee` GROUP BY `employee`.`province` ORDER BY NULL LIMIT 21; args=() # """
# 统计每一本书的作者个数 book_list = models.Book.objects.all().annotate(author_num=Count("author")) # 统计出每个出版社买的最便宜的书的价格 publisher_list = models.Publisher.objects.annotate(min_price=Min("book__price")) publisher_list = models.Book.objects.values("publisher__name").annotate(min_price=Min("price")) # 统计不止一个作者的图书 book_list = models.Book.objects.annotate(author_num=Count("author")).filter(author_num__gt=1) # 根据一本图书作者数量的多少对查询集 QuerySet进行排序 book_list = models.Book.objects.annotate(author_num=Count("author")).order_by("author_num") # 查询各个作者出的书的总价格 author_list = models.author.annotate(sum_price=Sum("book__price")).values("name", "sum_price"))
# ORM连表分组查询 # 根据 "部门" 计算出 "平均工资" 结果为显示为 "部门名字 : 平均工资" 的表 ret = models.Person.objects.values("dept_id").annotate(a=Avg("salary")).values("dept__name", "a") # """ # SELECT `dept`.`name`, AVG(`person`.`salary`) AS `a` FROM `person` INNER JOIN `dept` ON (`person`.`dept_id` = `dept`.`id`) GROUP BY `person`.`dept_id`, `dept`.`name` ORDER BY NULL LIMIT 21; args=() # """
查询每个部门的员工的员工数
关键点:
- queryset 对象.anntate()
- anntate 按前面的 select 字段进行 group by 分组统计 ,
- anntate() 的返回值依旧是 queryset 对象 , 只是增加了分组统计后的键值对
- 即 " 分组规则 " .anntate(" 连表操作,数据处理 ") . " 筛选字段 "
- 分组规则 :
- 基于queryset 方法 对分组关键字段进行筛选
- 即 "根据"什么
- 转换成 sql 语句 为 group by 后面的部分
- 基于queryset 方法 对分组关键字段进行筛选
- 连表操作,数据处理:
- 视情况进行是否连表,以及新增一个计算出的字段
- 即 " 计算 " 什么
- 视情况进行是否连表,以及新增一个计算出的字段
- 筛选字段:
- 基于queryset 方法 对新增字段进行筛选 并呈现最终结果
- 即 "想要" 什么
- 转换成 sql 语句 为 select 后面的部分
- 基于queryset 方法 对新增字段进行筛选 并呈现最终结果
- 分组规则 :
分组查询的超级详细的解析示例:
查询每个部门的员工总工总人数
F查询
概念
对于基础的两个值得比较可以通过上面的方法实现
但是对于两个字段的比较则需要用到 F 查询
示例
# 查询评论数大于收藏数的书籍 from django.db.models import F models.Book.objects.filter(commnet_num__gt=F('keep_num')) # Django 支持 F() 对象之间以及 F() 对象和常数之间的加减乘除和取模的操作。 models.Book.objects.filter(commnet_num__lt=F('keep_num')*2) # 对整个字段的所有值的操作也可以通过 F 函数实现 # 比如将每一本书的价格提高30元 models.Book.objects.all().update(price=F("price")+30)
关于修改 char 字段的操作
# 把所有书名后面加上(第一版) >>> from django.db.models.functions import Concat >>> from django.db.models import Value >>> models.Book.objects.all().update(title=Concat(F("title"), Value("("), Value("第一版"), Value(")")))
Q查询
概念
当使用filter 的时候 ,内部多个筛选条件是 and 的关系
若需求为 or 的关系需要用到 Q 查询
示例
# 查询作者名是羊驼或山羊的 models.Book.objects.filter(Q(authors__name="羊驼")|Q(authors__name="山羊"))
复杂示例
# 可以组合& 和| 操作符以及使用括号进行分组来编写任意复杂的Q 对象。同时,Q 对象可以使用~ 操作符取反,这允许组合正常的查询和取反(NOT) 查询。
# 查询作者名字是羊驼之歌并且不是2018年出版的书的书名。 models.Book.objects.filter(Q(author__name="羊驼之歌") & ~Q(publish_date__year=2018)).values_list("title")
注意
当 and 和 or 同时一起用的时候 , Q 查询需要放在前面
示例
# 查询出版年份是2017或2018,书名中带羊驼的所有书。 models.Book.objects.filter(Q(publish_date__year=2018) | Q(publish_date__year=2017), title__icontains="羊驼")
Q查询的另一种方法:
此方法比通常使用稍微复杂一些。本质上和 .filter(Q(title="yang")|Q(price=123)) 实现效果相同,
但是 这样子拆分出来可以实现 不在使用字段对象,而是用字符串来筛选
场景适用:
搜索框获取当前get 请求中的参数时,参数为字符串形式,用常规的Q查询必须依靠字段对象从而无法实现
q = Q() # 将Q实例化对象单独拿出来 q.connnection = "or" # 默认多条件的关系是 "and" 通过connection 可以改成其他 q.children.append(("title", "yang")) # 添加查询字段 q.children.append(("price", 123))
锁
限制住当前查询结束后才可以其他的操作.保证数据的可靠性
select_for_update(nowait=False, skip_locked=False)
示例
entries = Entry.objects.select_for_update().filter(author=request.user)
执行原生的sql 语句
1 # 查询person表,判断每个人的工资是否大于2000 2 # 利用子查询,可以写入原生的sql语句 3 ret = models.Person.objects.all().extra( 4 select={"gt": "salary > 2000"} 5 ) 6 7 # """ 8 # SELECT (salary > 2000) AS `gt`, `person`.`id`, `person`.`name`, `person`.`salary`, `person`.`dept_id` FROM `person` LIMIT 21; args=() 9 # """ 10 11 for i in ret: 12 print(i.name, i.gt)
1 # 执行完全的原生的SQL语句,类似pymql 2 from django.db import connection 3 cursor = connection.cursor() # 获取光标,等待执行SQL语句 4 cursor.execute("""SELECT * from person where id = %s""", [1]) 5 row = cursor.fetchone() 6 print(row)
本文来自博客园,作者:羊驼之歌,转载请注明原文链接:https://www.cnblogs.com/shijieli/p/10049144.html