九、Django之ORM
作者:@skyflask
转载本文请注明出处:https://www.cnblogs.com/skyflask/p/9363268.html
目录
一、ORM概述
二、ORM实现
三、ORM的关系
四、ORM的操作
五、惰性机制
六、多种查询
一、ORM概述
用于实现面向对象编程语言里不同类型系统的数据之间的转换,换言之,就是用面向对象的方式去操作数据库的创建表以及增删改查等操作。
到目前为止,当我们的程序涉及到数据库相关操作时,一般操作流程如下:
- 创建数据库,设计表结构和字段;
- 使用 MySQLdb 来连接数据库,并编写数据访问层代码,使用原生SQL语句进行访问数据;
- 业务逻辑层去调用数据访问层执行数据库操作,获取结果;
ORM是什么?Object Relational Mapping(关系对象映射)
1、类名------>数据库中的表名
2、类属性--------->数据库的字段
3、类实例--------->数据库表里的一条记录
4、obj.id obj.name------>获取类实例对象的属性
Django ORM的优势:
1、Django的orm操作本质是根据对接的数据库引擎,翻译成对应的sql语句, 避免新手写sql语句带来的性能问题,同时ORM使我们的通用数据库交互变得简单易行,而且完全不用考虑复杂的SQL语句。
2、所有使用Django开发的项目无需关心程序底层使用的是MySQL、Oracle、sqlite....等数据库,如果数据库需要迁移,只需要更换Django的数据库引擎即可;
二、ORM实现
为了更好的理解,我们来做一个基本的 地名(比如某个门牌号码)/餐馆/服务员 数据库结构,这个也是受Django官网的启发而自己定义的,可能不是非常恰当,但是可以帮助理解。
1、梳理关系和建模
场景如下:
在某条街上Place,有一家餐馆Restaurant,在这家餐馆里面有很多服务员Waiter,每个服务员在这条街上可能有多个住处Place,同时,这个Place可能住着多个服务员Waiter。
所以,这其中的关系可以梳理如下:
Place---->Restaurant(一对一):一条街上对应一家餐馆名
Restaurant---->Waiter(一对多):一个餐馆里面有多名服务员
Place---->Waiter(多对多):一个地方可能住着好几个服务员,而一个服务员可能在这条街上有好几个住所
2、定义表和确定字段
一个place有地名和地址
一个餐馆有唯一的地址和经营的餐饮项目
一个服务员有自己的姓名、住所、工作的餐馆
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 | from django.db import models class Place(models.Model): name = models.CharField(max_length = 50 ) address = models.CharField(max_length = 80 ) def __str__( self ): # __unicode__ on Python 2 return "%s the place" % self .name class Restaurant(models.Model): place = models.OneToOneField( Place, on_delete = models.CASCADE, primary_key = True , ) serves_hot_dogs = models.BooleanField(default = False ) serves_pizza = models.BooleanField(default = False ) def __str__( self ): # __unicode__ on Python 2 return "%s the restaurant" % self .place.name class Waiter(models.Model): restaurant = models.ForeignKey(Restaurant, on_delete = models.CASCADE) places = models.ManyToManyField(Place) name = models.CharField(max_length = 50 ) def __str__( self ): # __unicode__ on Python 2 return "%s the waiter at %s" % ( self .name, self .restaurant) |
3、setttings和同步数据库
a、在settings里的INSTALLED_APPS中加入'app'
1 2 3 4 5 6 7 8 9 10 11 | INSTALLED_APPS = [ 'django.contrib.admin' , 'django.contrib.auth' , 'django.contrib.contenttypes' , 'django.contrib.sessions' , 'django.contrib.messages' , 'django.contrib.staticfiles' , 'blog' , ] |
b、同步数据库。
1 | 1 、数据同步的准备工作python manager makemigrations |
1 | 2 、数据同步python manager migrate |
3、数据表结构
三、ORM的关系
关系数据库的威力体现在表之间的相互关联。 Django 提供了三种最常见的数据库关系:多对一(many-to-one),多对多(many-to-many),一对一(one-to-one)。其中多对一和多对多更为常见。
1、多对一(many-to-one)
Django 使用 django.db.models.ForeignKey
定义多对一关系。 和使用其它Field
类型一样:在模型当中把它做为一个类属性包含进来。
ForeignKey
需要一个位置参数:与该模型关联的类。记住:哪个是多,就在哪个里面写Foreiginkey。
比如,一个餐馆有多个服务员,但是一个服务员只能在一家餐馆工作,当然这里不考虑兼职的情况了。
2、一对一(one-to-one)
OneToOneField
用来定义一对一关系。 和使用其它Field
类型一样:在模型当中把它做为一个类属性包含进来。
当某个对象想扩展自另一个对象时,最常用的方式就是在这个对象的主键上添加一对一关系。
OneToOneField
要一个位置参数:与模型关联的类。
例如,如果你正在建立一个“places”的数据库,那么你将建立一个非常标准的地址、电话号码等 在数据库中。 接下来,如果你想在place数据库的基础上建立一个restaurant数据库,而不想将已有的字段复制到Restaurant
模型,那你可以在 Restaurant
添加一个OneToOneField
字段,这个字段指向Place
(因为Restaurant 本身就是一个Place;事实上,在处理这个问题的时候,你应该使用一个典型的 inheritance,它隐含一个一对一关系)。
与ForeignKey
一样,可以定义递归关系,并可以引用尚未定义的模型。
3、多对多(many-to-many)
ManyToManyField
用来定义多对多关系, 和使用其它Field
类型一样:在模型当中把它做为一个类属性包含进来。
ManyToManyField
需要一个位置参数:和该模型关联的类。
例如,一个Pizza
可以有多种Topping
即一种Topping
也可以位于多个Pizza上,而且每个Pizza
有多个topping
4、实例
a、我们进行对象的建立,首先进入python 的shell环境,然后导入对应的对象。建立2个place、2个restaurant、4个waiter
place1===>restaurant1(111街上有一间餐馆,名为:restaurant1)
waiter1和waiter2==>restaurant1(waiter1和waiter2工作在restaurant1)
waiter1==>hourse1和hourse2:(waiter1有hourse1和hourse2两个住所)
waiter2==>hourse2(waiter2只有hourse2一个住所)
place2===>restaurant2(222街上有一间餐馆,名为:restaurant2)
waiter3和waiter4===>restaurant2(waiter3和waiter4工作在restaurant2)
waiter3和waiter4==>hourse3(waiter3和waiter4同居在hourse3)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 | (venv) D:\xuequn\venv\Scripts\firstapp>python manage.py shell Python 2.7 . 15 (v2. 7.15 :ca079a3ea3, Apr 30 2018 , 16 : 30 : 26 ) [MSC v. 1500 64 bit (AM D64)] on win32 Type "help" , "copyright" , "credits" or "license" for more information. (InteractiveConsole) >>> from blog import models >>> from models import Place Traceback (most recent call last): File "<console>" , line 1 , in <module> ImportError: No module named models >>> from blog import models >>> from blog.models import Place >>> from blog.models import Restaurant >>> from blog.models import Waiter >>> place1 = Place(name = 'place1' ,address = '111-place1-west-road' ) >>> place1.save() >>> place2 = Place(name = 'place2' ,address = '222-place2-west-road' ) >>> place2.save() >>> res1 = Restaurant(place = place1,serves_hot_dogs = True ,serves_pizza = True ) >>> res1.save() >>> res2 = Restaurant(place = place2,serves_hot_dogs = True ,serves_pizza = False ) >>> res2.save() >>> w1 = Waiter(name = 'waiter1' ,restaurant = res1) >>> w1.save() >>> w2 = Waiter(name = 'waiter2' ,restaurant = res1) >>> >>> w2.save() >>> w3 = Waiter(name = 'waiter3' ,restaurant = res2) >>> w3.save() >>> w4 = Waiter(name = 'waiter4' ,restaurant = res2) >>> w4.save() >>> hourse1 = Place(name = 'hourse1' ,address = 'hourse1-east-road' ) >>> hourse1.save() >>> hourse2 = Place(name = 'hourse2' ,address = 'hourse2-east-road' ) >>> hourse2.save() >>> hourse3 = Place(name = 'hourse3' ,address = 'hourse3-east-road' ) >>> hourse3.save() >>> w1.places.add(hourse1) >>> w1.save() >>> w1.places.add(hourse2) >>> w1.save() >>> w2.places.add(hourse2) >>> w2.save() >>> w3.places.add(hourse3) >>> w3.save() >>> w4.places.add(hourse3) >>> w4.save() >>> |
注意:
1、一对一使用场景:当某个对象想扩展自另一个对象时,最常用的方式就是在这个对象的主键上添加一对一关系。这里的餐馆扩展了街道,餐馆除了有街道的地址属性以外,还有餐馆名称和经营项目等。
2、表A是表B的属性时,表A必须先save,表B才能使用表A,不然会报错:ValueError: save() prohibited to prevent data loss due to unsaved related object......
下面在此基础上进行增、删、改、查操作。
四、ORM的操作
1、增
在学习增操作前,我们先了解一下模型中常用的字段。
#################################################################常用字段
<1> CharField
1 2 | 字符串字段, 用于较短的字符串. CharField 要求必须有一个参数 maxlength, 用于从数据库层和Django校验层限制该字段所允许的最大字符数. |
<2> IntegerField
1 | 用于保存一个整数. |
<3> FloatField
1 2 3 4 5 6 7 8 9 10 11 | 一个浮点数. 必须 提供两个参数: 参数 描述 max_digits 总位数(不包括小数点和符号) decimal_places 小数位数 要保存最大值为 999 (小数点后保存2位),你要这样定义字段: models.FloatField(..., max_digits=5, decimal_places=2) 要保存最大值一百万(小数点后保存10位)的话,你要这样定义: models.FloatField(..., max_digits=19, decimal_places=10) admin 用一个文本框(< input type="text">)表示该字段保存的数据. |
<4> AutoField
1 2 3 | 一个 IntegerField, 添加记录时它会自动增长. 你通常不需要直接使用这个字段; 自定义一个主键:my_id=models.AutoField(primary_key=True) 如果你不指定主键的话,系统会自动添加一个主键字段到你的 model. |
<5> BooleanField
1 | A true/false field. admin 用 checkbox 来表示此类字段. |
<6> TextField
1 2 | 一个容量很大的文本字段. admin 用一个 < textarea > (文本区域)表示该字段数据.(一个多行编辑框). |
<7> EmailField
1 | 一个带有检查Email合法性的 CharField,不接受 maxlength 参数. |
<8> DateField
1 2 3 4 | 一个日期字段. 共有下列额外的可选参数: 参数 描述 auto_now 当对象被保存时,自动将该字段的值设置为当前时间.通常用于表示 "last-modified" 时间戳. auto_now_add 当对象首次被创建时,自动将该字段的值设置为当前时间.通常用于表示对象创建时间.(仅仅在admin中有意义...) |
<9> DateTimeField
1 | 一个日期时间字段. 类似 DateField 支持同样的附加选项. |
<10> ImageField
1 2 3 4 | 类似 FileField, 不过要校验上传对象是否是一个合法图片. 它有两个可选参数:height_field和width_field, 如果提供这两个参数,则图片将按提供的高度和宽度规格保存. |
<11> FileField
1 2 3 4 5 6 7 8 9 10 11 12 13 14 | # 一个文件上传字段. #要求一个必须有的参数: upload_to, 一个用于保存上载文件的本地文件系统路径. 这个路径必须包含 strftime #formatting, #该格式将被上载文件的 date/time #替换(so that uploaded files don't fill up the given directory). # admin 用一个< input type="file">部件表示该字段保存的数据(一个文件上传部件) . #注意:在一个 model 中使用 FileField 或 ImageField 需要以下步骤: #(1)在你的 settings 文件中, 定义一个完整路径给 MEDIA_ROOT 以便让 Django在此处保存上传文件. # (出于性能考虑,这些文件并不保存到数据库.) 定义MEDIA_URL 作为该目录的公共 URL. 要确保该目录对 # WEB服务器用户帐号是可写的. #(2) 在你的 model 中添加 FileField 或 ImageField, 并确保定义了 upload_to 选项,以告诉 Django # 使用 MEDIA_ROOT 的哪个子目录保存上传文件.你的数据库中要保存的只是文件的路径(相对于 MEDIA_ROOT). # 出于习惯你一定很想使用 Django 提供的 get_<#fieldname>_url 函数.举例来说,如果你的 ImageField # 叫作 mug_shot, 你就可以在模板中以 {{ object.#get_mug_shot_url }} 这样的方式得到图像的绝对路径. |
<12> URLField
1 2 | 用于保存 URL. 若 verify_exists 参数为 True (默认), 给定的 URL 会预先检查是否存在( 即URL是否被有效装入且 没有返回404响应). admin 用一个 < input type="text"> 文本框表示该字段保存的数据(一个单行编辑框) |
<13> NullBooleanField
1 2 | 类似 BooleanField, 不过允许 NULL 作为其中一个选项. 推荐使用这个字段而不要用 BooleanField 加 null=True 选项 admin 用一个选择框 < select > (三个可选择的值: "Unknown", "Yes" 和 "No" ) 来表示这种字段数据. |
<14> SlugField
1 2 3 4 5 6 | # "Slug" 是一个报纸术语. slug 是某个东西的小小标记(短签), 只包含字母,数字,下划线和连字符.#它们通常用于URLs # 若你使用 Django 开发版本,你可以指定 maxlength. 若 maxlength 未指定, Django 会使用默认长度: 50. #在 # 以前的 Django 版本,没有任何办法改变50 这个长度.这暗示了 db_index=True. # 它接受一个额外的参数: prepopulate_from, which is a list of fields from which to auto-#populate # the slug, via JavaScript,in the object's admin form: models.SlugField # (prepopulate_from=("pre_name", "name"))prepopulate_from 不接受 DateTimeFields. |
<15> XMLField
1 | #一个校验值是否为合法XML的 TextField,必须提供参数: schema_path, 它是一个用来校验文本的 RelaxNG schema #的文件系统路径. |
<16> FilePathField
1 2 3 4 5 6 7 8 9 10 11 12 | # 可选项目为某个特定目录下的文件名. 支持三个特殊的参数, 其中第一个是必须提供的. # 参数 描述 # path 必需参数. 一个目录的绝对文件系统路径. FilePathField 据此得到可选项目. # Example: "/home/images". # match 可选参数. 一个正则表达式, 作为一个字符串, FilePathField 将使用它过滤文件名. # 注意这个正则表达式只会应用到 base filename 而不是 # 路径全名. Example: "foo.*\.txt^", 将匹配文件 foo23.txt 却不匹配 bar.txt 或 foo23.gif. # recursive可选参数.要么 True 要么 False. 默认值是 False. 是否包括 path 下面的全部子目录. # 这三个参数可以同时使用. # match 仅应用于 base filename, 而不是路径全名. 那么,这个例子: # FilePathField(path="/home/images", match="foo.*", recursive=True) # ...会匹配 /home/images/foo.gif 而不匹配 /home/images/foo/bar.gif |
<17> IPAddressField
1 | 一个字符串形式的 IP 地址, (i.e. "24.124.1.30"). |
<18>CommaSeparatedIntegerField
1 | 用于存放逗号分隔的整数值. 类似 CharField, 必须要有maxlength参数. |
#######################################################Field重要参数
<1> null
1 | 数据库中字段是否可以为空 |
<2> blank
1 | django的 Admin 中添加数据时是否可允许空值 |
<3> default
1 | 设定缺省值 |
<4> editable
1 | 如果为假,admin模式下将不能改写。缺省为真 |
<5> primary_key
1 2 3 4 | 设置主键,如果没有设置django创建表时会自动加上: id = meta.AutoField('ID', primary_key=True) primary_key=True implies blank=False, null=False and unique=True. Only one primary key is allowed on an object. |
<6> unique
1 | 数据唯一 |
<7> verbose_name
1 | Admin中字段的显示名称 |
<8> validator_list
1 | 有效性检查。非有效产生 django.core.validators.ValidationError 错误 |
<9>db_column
1 | db_index 如果为真将为此字段创建索引 |
<10>choices
1 2 3 | 一个用来选择值的2维元组。第一个值是实际存储的值,第二个用来方便进行选择。 如:SEX_CHOICES= (( ‘F’,'Female’),(‘M’,'Male’),) gender = models.CharField(max_length=2,choices = SEX_CHOICES) |
-------------------------------------增操作(create方式,无需显示save) ------------------------------
1 2 3 4 5 | >>> from blog.models import * >>> Place.objects.create(name='place3',address='333-place3-west-road') < Place: place3 the place> >>> Place.objects.create(**{'name':'place4','address':'444-place4-west-road'}) < Place: place4 the place> |
-------------------------------------增操作(显示save方式) ------------------------------
1 2 3 4 | >>> place1=Place(name='place1',address='111-place1-west-road') >>> place1.save() >>> place2=Place(name='place2',address='222-place2-west-road') >>> place2.save() |
2、删
-------------------------------------删操作(delete方法) ------------------------------
1 2 3 4 | >>> p3=Place.objects.filter(name='place3') >>> p3 < QuerySet [<Place: place3 the place>]> >>> p3=Place.objects.filter(name='place3').delete() |
------------------------------删操作( remove()和clear()方法) --------------
1 2 3 4 5 6 7 8 9 | book = models.Book.objects.filter(id=1) book.author.clear() #清空与book中id=1 关联的所有数据 book.author.remove(2) #可以为id book.author.remove(*[1,2,3,4]) #可以为列表,前面加* #反向 author = models.Author.objects.filter(id=1) author.book_set.clear() #清空与boy中id=1 关联的所有数据 |
3、改
----------------------------------------改(直接修改属性后save) ----------------------------------------
1 2 3 4 5 6 | >>> h3=Place.objects.get(id=9) >>> h3 < Place: hourse3 the place> >>> h3.address='hourse3-west-road' >>> h3.save() >>> |
这种方法需要知道被修改内容的ID号。
----------------------------------------改(级联update方法) ----------------------------------------
1 2 3 4 5 6 | >>> Place.objects.filter(id=9).update(address='new_place') 1 >>> h3=Place.objects.get(id=9) >>> h3.address u'new_place' >>> |
第二种方式修改不能用get的原因是:update是QuerySet对象的方法,get返回的是一个model对象,它没有update方法,而filter返回的是一个QuerySet对象(filter里面的条件可能有多个条件符合,比如name='alvin',可能有两个name='alvin'的行数据)。
在“插入和更新数据”小节中,我们有提到模型的save()方法,这个方法会更新一行里的所有列。 而某些情况下,我们只需要更新行里的某几列。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | 一、update方法直接设置对应的属性#---------------- update方法直接设定对应属性---------------- models.Book.objects.filter(id=3).update(title="PHP") ##sql: ##UPDATE "app01_book" SET "title" = 'PHP' WHERE "app01_book"."id" = 3; args=('PHP', 3) 二、save方法会把所有属性都重新设定一遍 #--------------- save方法会将所有属性重新设定一遍,效率低----------- obj=models.Book.objects.filter(id=3)[0] obj.title="Python" obj.save()1、先查出所有数据 # SELECT "app01_book"."id", "app01_book"."title", "app01_book"."price", # "app01_book"."color", "app01_book"."page_num", # "app01_book"."publisher_id" FROM "app01_book" WHERE "app01_book"."id" = 3 LIMIT 1; 2、把所有字段都更新一次 # UPDATE "app01_book" SET "title" = 'Python', "price" = 3333, "color" = 'red', "page_num" = 556, # "publisher_id" = 1 WHERE "app01_book"."id" = 3; |
在这个例子里我们可以看到Django的save()方法更新了不仅仅是title列的值,还有更新了所有的列。 若title以外的列有可能会被其他的进程所改动的情况下,只更改title列显然是更加明智的。更改某一指定的列,我们可以调用结果集(QuerySet)对象的update()方法,与之等同的SQL语句变得更高效,并且不会引起竞态条件。
此外,update()方法对于任何结果集(QuerySet)均有效,这意味着你可以同时更新多条记录update()方法会返回一个整型数值,表示受影响的记录条数。
注意,这里因为update返回的是一个整形,所以没法用query属性;对于每次创建一个对象,想显示对应的raw sql,需要在settings加上日志记录部分:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 | LOGGING = { 'version': 1, 'disable_existing_loggers': False, 'handlers': { 'console':{ 'level':'DEBUG', 'class':'logging.StreamHandler', }, }, 'loggers': { 'django.db.backends': { 'handlers': ['console'], 'propagate': True, 'level':'DEBUG', }, } } LOGGING |
注意:如果是多对多的改:
1 2 3 4 5 | obj=Book.objects.filter(id=1)[0] author=Author.objects.filter(id__gt=2) obj.author.clear() obj.author.add(*author) |
4、查
---------------------------------------查(filter,value等) -------------------------------------
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | # 查询相关API: # < 1 >filter(**kwargs): 它包含了与所给筛选条件相匹配的对象 # < 2 >all(): 查询所有结果 # < 3 >get(**kwargs): 返回与所给筛选条件相匹配的对象,返回结果有且只有一个,如果符合筛选条件的对象超过一个或者没有都会抛出错误。 #-----------下面的方法都是对查询的结果再进行处理:比如 objects.filter.values()-------- # < 4 >values(*field): 返回一个ValueQuerySet——一个特殊的QuerySet,运行后得到的并不是一系列 model的实例化对象,而是一个可迭代的字典序列 # < 5 >exclude(**kwargs): 它包含了与所给筛选条件不匹配的对象 # < 6 >order_by(*field): 对查询结果排序 # < 7 >reverse(): 对查询结果反向排序 # < 8 >distinct(): 从返回结果中剔除重复纪录 # < 9 >values_list(*field): 它与values()非常相似,它返回的是一个元组序列,values返回的是一个字典序列 # < 10 >count(): 返回数据库中匹配查询(QuerySet)的对象数量。 # < 11 >first(): 返回第一条记录 # < 12 >last(): 返回最后一条记录 # < 13 >exists(): 如果QuerySet包含数据,就返回True,否则返回False。 |
扩展:
1 2 3 4 5 6 7 8 9 10 11 12 | #扩展查询,有时候DJANGO的查询API不能方便的设置查询条件,提供了另外的扩展查询方法extra: #extra(select=None, where=None, params=None, tables=None,order_by=None, select_params=None (1) Entry.objects.extra(select={'is_recent': "pub_date > '2006-01-01'"}) (2) Blog.objects.extra( select=SortedDict([('a', '%s'), ('b', '%s')]), select_params=('one', 'two')) (3) q = Entry.objects.extra(select={'is_recent': "pub_date > '2006-01-01'"}) q = q.extra(order_by = ['-is_recent']) (4) Entry.objects.extra(where=['headline=%s'], params=['Lennon']) |
五、惰性机制
所谓惰性机制:Publisher.objects.all()或者.filter()等都只是返回了一个QuerySet(查询结果集对象),它并不会马上执行sql,而是当调用QuerySet的时候才执行。其实就是迭代器。
1、QuerySet特点
<1> 可迭代的
<2> 可切片
1 2 3 4 5 6 7 8 9 10 11 | #objs=models.Book.objects.all()#[obj1,obj2,ob3...] #QuerySet: 可迭代 # for obj in objs:#每一obj就是一个行对象 # print("obj:",obj) # QuerySet: 可切片 # print(objs[1]) # print(objs[1:4]) # print(objs[::-1]) |
2、QuerySet的高效使用
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 | < 1 >Django的queryset是惰性的 Django的queryset对应于数据库的若干记录(row),通过可选的查询来过滤。例如,下面的代码会得 到数据库中名字为‘Dave’的所有的人:person_set = Person.objects.filter(first_name="Dave") 上面的代码并没有运行任何的数据库查询。你可以使用person_set,给它加上一些过滤条件,或者将它传给某个函数, 这些操作都不会发送给数据库。这是对的,因为数据库查询是显著影响web应用性能的因素之一。 < 2 >要真正从数据库获得数据,你可以遍历queryset或者使用if queryset,总之你用到数据时就会执行sql. 为了验证这些,需要在settings里加入 LOGGING(验证方式) obj=models.Book.objects.filter(id=3) # for i in obj: # print(i) # if obj: # print("ok") < 3 >queryset是具有cache的 当你遍历queryset时,所有匹配的记录会从数据库获取,然后转换成Django的model。这被称为执行 (evaluation).这些model会保存在queryset内置的cache中,这样如果你再次遍历这个queryset, 你不需要重复运行通用的查询。 obj=models.Book.objects.filter(id=3) # for i in obj: # print(i) ## models.Book.objects.filter(id=3).update(title="GO") ## obj_new=models.Book.objects.filter(id=3) # for i in obj: # print(i) #LOGGING只会打印一次 < 4 >简单的使用if语句进行判断也会完全执行整个queryset并且把数据放入cache,虽然你并不需要这些数据!为了避免这个,可以用exists()方法来检查是否有数据: obj = Book.objects.filter(id=4) # exists()的检查可以避免数据放入queryset的cache。 if obj.exists(): print("hello world!") < 5 >当queryset非常巨大时,cache会成为问题 处理成千上万的记录时,将它们一次装入内存是很浪费的。更糟糕的是,巨大的queryset可能会锁住系统 进程,让你的程序濒临崩溃。要避免在遍历数据的同时产生queryset cache,可以使用iterator()方法 来获取数据,处理完数据就将其丢弃。 objs = Book.objects.all().iterator() # iterator()可以一次只从数据库获取少量数据,这样可以节省内存 for obj in objs: print(obj.name) #BUT,再次遍历没有打印,因为迭代器已经在上一次遍历(next)到最后一次了,没得遍历了 for obj in objs: print(obj.name) #当然,使用iterator()方法来防止生成cache,意味着遍历同一个queryset时会重复执行查询。所以使 #用iterator()的时候要当心,确保你的代码在操作一个大的queryset时没有重复执行查询 总结: queryset的cache是用于减少程序对数据库的查询,在通常的使用下会保证只有在需要的时候才会查询数据库。 使用exists()和iterator()方法可以优化程序对内存的使用。不过,由于它们并不会生成queryset cache,可能 会造成额外的数据库查询。 |
六、多种查询
1、对象查询,单表条件查询,多表条件关联查询
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 | #--------------------对象形式的查找-------------------------- # 正向查找 ret1=models.Book.objects.first() print(ret1.title) print(ret1.price) print(ret1.publisher) print(ret1.publisher.name) #因为一对多的关系所以ret1.publisher是一个对象,而不是一个queryset集合 # 反向查找 ret2=models.Publish.objects.last() print(ret2.name) print(ret2.city) #如何拿到与它绑定的Book对象呢? print(ret2.book_set.all()) #ret2.book_set是一个queryset集合 #---------------了不起的双下划线(__)之单表条件查询---------------- # models.Tb1.objects.filter(id__lt=10, id__gt=1) # 获取id大于1 且 小于10的值 # # models.Tb1.objects.filter(id__in=[11, 22, 33]) # 获取id等于11、22、33的数据 # models.Tb1.objects.exclude(id__in=[11, 22, 33]) # not in # # models.Tb1.objects.filter(name__contains="ven") # models.Tb1.objects.filter(name__icontains="ven") # icontains大小写不敏感 # # models.Tb1.objects.filter(id__range=[1, 2]) # 范围bettwen and # # startswith,istartswith, endswith, iendswith, #----------------了不起的双下划线(__)之多表条件关联查询--------------- # 正向查找(条件) # ret3=models.Book.objects.filter(title='Python').values('id') # print(ret3)#[{'id': 1}] #正向查找(条件)之一对多 ret4=models.Book.objects.filter(title='Python').values('publisher__city') print(ret4) #[{'publisher__city': '北京'}] #正向查找(条件)之多对多 ret5=models.Book.objects.filter(title='Python').values('author__name') print(ret5) ret6=models.Book.objects.filter(author__name="alex").values('title') print(ret6) #注意 #正向查找的publisher__city或者author__name中的publisher,author是book表中绑定的字段 #一对多和多对多在这里用法没区别 # 反向查找(条件) #反向查找之一对多: ret8=models.Publisher.objects.filter(book__title='Python').values('name') print(ret8)#[{'name': '人大出版社'}] 注意,book__title中的book就是Publisher的关联表名 ret9=models.Publisher.objects.filter(book__title='Python').values('book__authors') print(ret9)#[{'book__authors': 1}, {'book__authors': 2}] #反向查找之多对多: ret10=models.Author.objects.filter(book__title='Python').values('name') print(ret10)#[{'name': 'alex'}, {'name': 'alvin'}] #注意 #正向查找的book__title中的book是表名Book #一对多和多对多在这里用法没区别 |
注意:条件查询即与对象查询对应,是指在filter,values等方法中的通过__来明确查询条件
2、聚合查询和分组查询
<1> aggregate(*args,**kwargs):
通过对QuerySet进行计算,返回一个聚合值的字典。aggregate()中每一个参数都指定一个包含在字典中的返回值。即在查询集上生成聚合。(对QuerySet整体进行计算,得到聚合函数的值的字典)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 | from django.db.models import Avg,Min,Sum,Max 从整个查询集生成统计值。比如,你想要计算所有在售书的平均价钱。Django的查询语法提供了一种方式描述所有 图书的集合。 >>> Book.objects.all().aggregate(Avg('price')) {'price__avg': 34.35} aggregate()子句的参数描述了我们想要计算的聚合值,在这个例子中,是Book模型中price字段的平均值 aggregate()是QuerySet 的一个终止子句,意思是说,它返回一个包含一些键值对的字典。键的名称是聚合值的 标识符,值是计算出来的聚合值。键的名称是按照字段和聚合函数的名称自动生成出来的。如果你想要为聚合值指定 一个名称,可以向聚合子句提供它: >>> Book.objects.aggregate(average_price=Avg('price')) {'average_price': 34.35} 如果你也想知道所有图书价格的最大值和最小值,可以这样查询: >>> Book.objects.aggregate(Avg('price'), Max('price'), Min('price')) {'price__avg': 34.35, 'price__max': Decimal('81.20'), 'price__min': Decimal('12.99')} |
<2> annotate(*args,**kwargs)
可以通过计算查询结果中每一个对象所关联的对象集合,从而得出总计值(也可以是平均值或总和),即为查询集的每一项生成聚合。(对查询结果按条件分组后的集合进行计算,返回每个分组的字典集合)
1 2 3 4 5 | >>> Place.objects.filter(name='place1').aggregate(Sum('id')) (0.001) SELECT SUM("blog_place"."id") AS "id__sum" FROM "blog_place" WHERE "blog _place"."name" = 'place1'; args=('place1',) {'id__sum': 5} >>> |
查询每个地址的id总和,这里就涉及到分组了(当然,这里不是很合理,一般是某个name对应多个id值时,才使用相加),分组条件是name
1 2 3 4 5 6 7 | >>> Place.objects.values("name").annotate(Sum('id')); (0.001) SELECT "blog_place"."name", SUM("blog_place"."id") AS "id__sum" FROM "bl og_place" GROUP BY "blog_place"."name" LIMIT 21; args=() < QuerySet [{'name': u'hourse1', 'id__sum': 7}, {'name': u'hourse2', 'id__sum': 8 }, {'name': u'hourse3', 'id__sum': 9}, {'name': u'place1', 'id__sum': 5}, {'name ': u'place2', 'id__sum': 6}]> >>> |
查询每个place,最小的id
1 2 3 4 5 6 7 | >>> Place.objects.values('name').annotate(Min('id')); (0.001) SELECT "blog_place"."name", MIN("blog_place"."id") AS "id__min" FROM "bl og_place" GROUP BY "blog_place"."name" LIMIT 21; args=() < QuerySet [{'id__min': 7, 'name': u'hourse1'}, {'id__min': 8, 'name': u'hourse2' }, {'id__min': 9, 'name': u'hourse3'}, {'id__min': 5, 'name': u'place1'}, {'id__ min': 6, 'name': u'place2'}]> >>> |
注意:这里是因为settings里面设置了Logging选项,所以你会看到每次查询的raw SQL。
3、F查询和Q查询
仅仅靠单一的关键字参数查询已经很难满足查询要求。此时Django为我们提供了F和Q查询。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 | # F 使用查询条件的值,专门取对象中某列值的操作(每本书的价格提高20元) # from django.db.models import F # models.Tb1.objects.update(num=F('num')+1) # Q 构建搜索条件(与、或、非、条件,非常灵活!!!) from django.db.models import Q #1 Q对象(django.db.models.Q)可以对关键字参数进行封装,从而更好地应用多个查询 q1=models.Book.objects.filter(Q(title__startswith='P')).all() print(q1)#[< Book: Python>, < Book: Perl>] # 2、可以组合使用&,|操作符,当一个操作符是用于两个Q的对象,它产生一个新的Q对象。 Q(title__startswith='P') | Q(title__startswith='J') # 3、Q对象可以用~操作符放在前面表示否定,也可允许否定与不否定形式的组合 Q(title__startswith='P') | ~Q(pub_date__year=2005) # 4、应用范围: # Each lookup function that takes keyword-arguments (e.g. filter(), # exclude(), get()) can also be passed one or more Q objects as # positional (not-named) arguments. If you provide multiple Q object # arguments to a lookup function, the arguments will be “AND”ed # together. For example: Book.objects.get( Q(title__startswith='P'), Q(pub_date=date(2005, 5, 2)) | Q(pub_date=date(2005, 5, 6)) ) #sql: # SELECT * from polls WHERE question LIKE 'P%' # AND (pub_date = '2005-05-02' OR pub_date = '2005-05-06') # import datetime # e=datetime.date(2005,5,6) #2005-05-06 # 5、Q对象可以与关键字参数查询一起使用,不过一定要把Q对象放在关键字参数查询的前面。 # 正确: Book.objects.get( Q(pub_date=date(2005, 5, 2)) | Q(pub_date=date(2005, 5, 6)), title__startswith='P') # 错误:和函数一样,关键字参数必须放后面!! Book.objects.get( question__startswith='P', Q(pub_date=date(2005, 5, 2)) | Q(pub_date=date(2005, 5, 6))) |
七、raw sql
django中models的操作,也是调用了ORM框架来实现的,pymysql 或者mysqldb,所以我们也可以使用原生的SQL语句来操作数据库!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾(3.3-3.9)
· AI 智能体引爆开源社区「GitHub 热点速览」