Django之orm
一些说明:
- 表myapp_person的名称是自动生成的,如果你要自定义表名,需要在model的Meta类中指定 db_table 参数,强烈建议使用小写表名,特别是使用MySQL作为后端数据库时。
- id字段是自动添加的,如果你想要指定自定义主键,只需在其中一个字段中指定 primary_key=True 即可。如果Django发现你已经明确地设置了Field.primary_key,它将不会添加自动ID列。
- 本示例中的CREATE TABLE SQL使用PostgreSQL语法进行格式化,但值得注意的是,Django会根据配置文件中指定的数据库后端类型来生成相应的SQL语句。
- Django支持MySQL5.5及更高版本。
Django ORM 常用字段和参数
常用字段
AutoField
int自增列,必须填入参数 primary_key=True。当model中如果没有自增列,则自动会创建一个列名为id的列。
IntegerField
一个整数类型,范围在 -2147483648 to 2147483647。(一般不用它来存手机号(位数也不够),直接用字符串存,)
CharField
字符类型,必须提供max_length参数, max_length表示字符长度。
这里需要知道的是Django中的CharField对应的MySQL数据库中的varchar类型,没有设置对应char类型的字段,但是Django允许我们自定义新的字段,下面我来自定义对应于数据库的char类型
自定义字段在实际项目应用中可能会经常用到,这里需要对他留个印象!
from django.db import models # Create your models here. #Django中没有对应的char类型字段,但是我们可以自己创建 class FixCharField(models.Field): ''' 自定义的char类型的字段类 ''' def __init__(self,max_length,*args,**kwargs): self.max_length=max_length super().__init__(max_length=max_length,*args,**kwargs) def db_type(self, connection): ''' 限定生成的数据库表字段类型char,长度为max_length指定的值 :param connection: :return: ''' return 'char(%s)'%self.max_length #应用上面自定义的char类型 class Class(models.Model): id=models.AutoField(primary_key=True) title=models.CharField(max_length=32) class_name=FixCharField(max_length=16) gender_choice=((1,'男'),(2,'女'),(3,'保密')) gender=models.SmallIntegerField(choices=gender_choice,default=3)
DateField
日期字段,日期格式 YYYY-MM-DD,相当于Python中的datetime.date()实例。
DateTimeField
日期时间字段,格式 YYYY-MM-DD HH:MM[:ss[.uuuuuu]][TZ],相当于Python中的datetime.datetime()实例。
字段合集(争取记忆)
AutoField(Field) - int自增列,必须填入参数 primary_key=True BigAutoField(AutoField) - bigint自增列,必须填入参数 primary_key=True 注:当model中如果没有自增列,则自动会创建一个列名为id的列 from django.db import models class UserInfo(models.Model): # 自动创建一个列名为id的且为自增的整数列 username = models.CharField(max_length=32) class Group(models.Model): # 自定义自增列 nid = models.AutoField(primary_key=True) name = models.CharField(max_length=32) SmallIntegerField(IntegerField): - 小整数 -32768 ~ 32767 PositiveSmallIntegerField(PositiveIntegerRelDbTypeMixin, IntegerField) - 正小整数 0 ~ 32767 IntegerField(Field) - 整数列(有符号的) -2147483648 ~ 2147483647 PositiveIntegerField(PositiveIntegerRelDbTypeMixin, IntegerField) - 正整数 0 ~ 2147483647 BigIntegerField(IntegerField): - 长整型(有符号的) -9223372036854775808 ~ 9223372036854775807 BooleanField(Field) - 布尔值类型 NullBooleanField(Field): - 可以为空的布尔值 CharField(Field) - 字符类型 - 必须提供max_length参数, max_length表示字符长度 TextField(Field) - 文本类型 EmailField(CharField): - 字符串类型,Django Admin以及ModelForm中提供验证机制 IPAddressField(Field) - 字符串类型,Django Admin以及ModelForm中提供验证 IPV4 机制 GenericIPAddressField(Field) - 字符串类型,Django Admin以及ModelForm中提供验证 Ipv4和Ipv6 - 参数: protocol,用于指定Ipv4或Ipv6, 'both',"ipv4","ipv6" unpack_ipv4, 如果指定为True,则输入::ffff:192.0.2.1时候,可解析为192.0.2.1,开启此功能,需要protocol="both" URLField(CharField) - 字符串类型,Django Admin以及ModelForm中提供验证 URL SlugField(CharField) - 字符串类型,Django Admin以及ModelForm中提供验证支持 字母、数字、下划线、连接符(减号) CommaSeparatedIntegerField(CharField) - 字符串类型,格式必须为逗号分割的数字 UUIDField(Field) - 字符串类型,Django Admin以及ModelForm中提供对UUID格式的验证 FilePathField(Field) - 字符串,Django Admin以及ModelForm中提供读取文件夹下文件的功能 - 参数: path, 文件夹路径 match=None, 正则匹配 recursive=False, 递归下面的文件夹 allow_files=True, 允许文件 allow_folders=False, 允许文件夹 FileField(Field) - 字符串,路径保存在数据库,文件上传到指定目录 - 参数: upload_to = "" 上传文件的保存路径 storage = None 存储组件,默认django.core.files.storage.FileSystemStorage ImageField(FileField) - 字符串,路径保存在数据库,文件上传到指定目录 - 参数: upload_to = "" 上传文件的保存路径 storage = None 存储组件,默认django.core.files.storage.FileSystemStorage width_field=None, 上传图片的高度保存的数据库字段名(字符串) height_field=None 上传图片的宽度保存的数据库字段名(字符串) DateTimeField(DateField) - 日期+时间格式 YYYY-MM-DD HH:MM[:ss[.uuuuuu]][TZ] DateField(DateTimeCheckMixin, Field) - 日期格式 YYYY-MM-DD TimeField(DateTimeCheckMixin, Field) - 时间格式 HH:MM[:ss[.uuuuuu]] DurationField(Field) - 长整数,时间间隔,数据库中按照bigint存储,ORM中获取的值为datetime.timedelta类型 FloatField(Field) - 浮点型 DecimalField(Field) - 10进制小数 - 参数: max_digits,小数总长度 decimal_places,小数位长度 BinaryField(Field) - 二进制类型
对应关系: 'AutoField': 'integer AUTO_INCREMENT', 'BigAutoField': 'bigint AUTO_INCREMENT', 'BinaryField': 'longblob', 'BooleanField': 'bool', 'CharField': 'varchar(%(max_length)s)', 'CommaSeparatedIntegerField': 'varchar(%(max_length)s)', 'DateField': 'date', 'DateTimeField': 'datetime', 'DecimalField': 'numeric(%(max_digits)s, %(decimal_places)s)', 'DurationField': 'bigint', 'FileField': 'varchar(%(max_length)s)', 'FilePathField': 'varchar(%(max_length)s)', 'FloatField': 'double precision', 'IntegerField': 'integer', 'BigIntegerField': 'bigint', 'IPAddressField': 'char(15)', 'GenericIPAddressField': 'char(39)', 'NullBooleanField': 'bool', 'OneToOneField': 'integer', 'PositiveIntegerField': 'integer UNSIGNED', 'PositiveSmallIntegerField': 'smallint UNSIGNED', 'SlugField': 'varchar(%(max_length)s)', 'SmallIntegerField': 'smallint', 'TextField': 'longtext', 'TimeField': 'time', 'UUIDField': 'char(32)', ORM字段与MySQL字段对应关系
字段参数
null
用于表示某个字段可以为空。
unique
如果设置为unique=True 则该字段在此表中必须是唯一的 。
db_index
如果db_index=True 则代表着为此字段设置索引。
default
为该字段设置默认值。
DateField和DateTimeField
auto_now_add
配置auto_now_add=True,创建数据记录的时候会把当前时间添加到数据库。
auto_now
配置上auto_now=True,每次更新数据记录的时候会更新该字段。
关系字段
ForeignKey
外键类型在ORM中用来表示外键关联关系,一般把ForeignKey字段设置在 '一对多'中'多'的一方。
ForeignKey可以和其他表做关联关系同时也可以和自身做关联关系。
字段参数
to
设置要关联的表
to_field
设置要关联的表的字段
on_delete
当删除关联表中的数据时,当前表与其关联的行的行为。
models.CASCADE
删除关联数据,与之关联也删除
db_constraint
是否在数据库中创建外键约束,默认为True。
models.DO_NOTHING
删除关联数据,引发错误IntegrityError
models.PROTECT
删除关联数据,引发错误ProtectedError
models.SET_NULL
删除关联数据,与之关联的值设置为null(前提FK字段需要设置为可空)
models.SET_DEFAULT
删除关联数据,与之关联的值设置为默认值(前提FK字段需要设置默认值)
models.SET
删除关联数据,
a. 与之关联的值设置为指定值,设置:models.SET(值)
b. 与之关联的值设置为可执行对象的返回值,设置:models.SET(可执行对象)
def func(): return 10 class MyModel(models.Model): user = models.ForeignKey( to="User", to_field="id", on_delete=models.SET(func) )
OneToOneField
一对一字段。
通常一对一字段用来扩展已有字段。(通俗的说就是一个人的所有信息不是放在一张表里面的,简单的信息一张表,隐私的信息另一张表,之间通过一对一外键关联)
字段参数
to
设置要关联的表。
to_field
设置要关联的字段。
on_delete
当删除关联表中的数据时,当前表与其关联的行的行为。(参考上面的例子)
一般操作
在进行一般操作时先配置一下参数,使得我们可以直接在Django页面中运行我们的测试脚本
在Python脚本中调用Django环境
这样就可以直接运行你的test.py文件来运行测试
必知必会13条
操作下面的操作之前,我们实现创建好了数据表,这里主要演示下面的操作,不再细讲创建准备过程
<1> all(): 查询所有结果
<2> filter(**kwargs): 它包含了与所给筛选条件相匹配的对象
<3> get(**kwargs): 返回与所给筛选条件相匹配的对象,返回结果有且只有一个,如果符合筛选条件的对象超过一个或者没有都会抛出错误。
<4> exclude(**kwargs): 它包含了与所给筛选条件不匹配的对象
<5> values(*field): 返回一个ValueQuerySet——一个特殊的QuerySet,运行后得到的并不是一系列model的实例化对象,而是一个可迭代的字典序列
<6> values_list(*field): 它与values()非常相似,它返回的是一个元组序列,values返回的是一个字典序列
<7> order_by(*field): 对查询结果排序
<8> reverse(): 对查询结果反向排序,请注意reverse()通常只能在具有已定义顺序的QuerySet上调用(在model类的Meta中指定ordering或调用order_by()方法)。
<9> distinct(): 从返回结果中剔除重复纪录(如果你查询跨越多个表,可能在计算QuerySet时得到重复的结果。此时可以使用distinct(),注意只有在PostgreSQL中支持按字段去重。)
<10> count(): 返回数据库中匹配查询(QuerySet)的对象数量。
<11> first(): 返回第一条记录
<12> last(): 返回最后一条记录
<13> exists(): 如果QuerySet包含数据,就返回True,否则返回False
13个必会操作总结
返回QuerySet对象的方法有
all()
filter()
exclude()
order_by()
reverse()
distinct()
特殊的QuerySet
values() 返回一个可迭代的字典序列
values_list() 返回一个可迭代的元祖序列
返回具体对象的
get()
first()
last()
返回布尔值的方法有:
exists()
返回数字的方法有
count()
# 一对多的字段的增删改查 # 增 # publish_id传数字 models.Book.objects.create(title='三国演义',price=189.99,publish_id=1) # publish直接传出版社对象 publish_obj = models.Publish.objects.filter(pk=2).first() models.Book.objects.create(title='红楼梦',price=999.99,publish=publish_obj) # # 改 # 传数字的 models.Book.objects.filter(pk=1).update(publish_id=3) # 传对象的 publish_obj = models.Publish.objects.filter(pk=2).first() models.Book.objects.filter(pk=1).update(publish=publish_obj) # # 删 models.Publish.objects.filter(pk=2).delete() # 默认都是级联更新 级联删除 # 多对多字段的增删改查 # 增 # 要给主键为1的书籍添加两个作者 book_obj = models.Book.objects.filter(pk=1).first() print(book_obj.authors) # 对象点击多对多虚拟字段 会直接跨到多对多的第三张表 book_obj.authors.add(1) book_obj.authors.add(2,3) author_obj = models.Author.objects.filter(pk=1).first() author_obj1 = models.Author.objects.filter(pk=2).first() author_obj2 = models.Author.objects.filter(pk=3).first() book_obj.authors.add(author_obj) book_obj.authors.add(author_obj1,author_obj2) """ add() 是给书籍添加作者 括号内既可以传数字也可以传对象 并且支持一次性传多个 逗号隔开即可 """ # 改 # 将主键为1的书籍对象 作者修改为2,3 book_obj = models.Book.objects.filter(pk=1).first() book_obj.authors.set([2,]) book_obj.authors.set([2,3]) author_obj = models.Author.objects.filter(pk=1).first() author_obj1 = models.Author.objects.filter(pk=2).first() author_obj2 = models.Author.objects.filter(pk=3).first() book_obj.authors.set([author_obj,]) book_obj.authors.set([author_obj, author_obj1, author_obj2])
"""
set()内传的值,多对多表中的不与set可迭代对象数据匹配时,那就删除,有就保留,再进行添加set内的其他数据
"""
""" set()括号内 需要传一个可迭代对象 可迭代对象中 可以是多个数字组合 也可以是多个对象组合 但是不要混着用!!! """ # 删 book_obj = models.Book.objects.filter(pk=1).first() # book_obj.authors.remove(3) book_obj.authors.remove(1,2) author_obj = models.Author.objects.filter(pk=1).first() author_obj1 = models.Author.objects.filter(pk=2).first() author_obj2 = models.Author.objects.filter(pk=3).first() book_obj.authors.remove(author_obj) book_obj.authors.remove(author_obj1,author_obj2) """ remove()括号内既可以传数字 也可以传对象 并且支持传对个 逗号隔开即可 """ # 将某本书跟作者的关系全部清空 book_obj = models.Book.objects.filter(pk=1).first() book_obj.authors.clear() # 清空当前书籍与作者的所有关系 """ add() set() remove() 上面三个都支持传数字 或者对象 并且可以传多个 但是set需要传可迭代对象 clear() clear括号内不需要传任何参数 """
"""
正向与反向的概念
# 一对一
# 正向:author---关联字段在author表里--->authordetail 按字段
# 反向:authordetail---关联字段在author表里--->author 按表名小写
# 一对多
# 正向:book---关联字段在book表里--->publish 按字段
# 反向:publish---关联字段在book表里--->book 按表名小写_set.all() 因为一个出版社对应着多个图书
# 多对多
# 正向:book---关联字段在book表里--->author 按字段
# 反向:author---关联字段在book表里--->book 按表名小写_set.all() 因为一个作者对应着多个图书
正向查询按外键字段
反向查询按表名小写
"""
"""基于对象的跨表查询(子查询:将一张表的查询结果当做另外一个查询语句的条件)"""
"""
强调:在书写orm语句的时候 跟写sql语句一样
不要尝试着 一次性写完 应该做到写一点看一点再一点
"""
"""
当你反向查询的结果是多个的时候 就需要加_set
否则直接表明小写即可
"""
# 1.查询书籍id是10 的出版社名称 res = models.Book.objects.filter(pk=10).first() print(res) print(res.publish.name) print(models.Book.objects.filter(pk=10).values('publish__name')) # 2.查询书籍id是10 的作者姓名 res = models.Book.objects.filter(pk=10).first() for i in res.author.all(): print(i.name) res = models.Book.objects.filter(pk=10).values('author__name') print(res) # 3.查询作者是tank的家庭住址 res = models.Author.objects.filter(name='tank').first() print(res.author_detail.addr) res = models.Author.objects.filter(name='tank').values('author_detail__addr') print(res) # 4.查询出版社是南京热出版的书籍 res = models.Publish.objects.filter(name='南京热').first() print(res.book_set.all()) res = models.Publish.objects.filter(name='南京热').values('book__title') print(res) # 5.查询作者是kevin的写过的所有的书籍 res = models.Author.objects.filter(name='kevin').first() print(res.book_set.all()) res = models.Author.objects.filter(name='kevin').values('book__title') print(res) # 6.查询电话号码是110的作者姓名 res = models.AuthorDetail.objects.filter(phone=110).first() print(res.author.name) res = models.AuthorDetail.objects.filter(phone=110).values('author__name') print(res) res = models.Author.objects.filter(author_detail__phone=110).values('name') print(res) # 7.查询书籍id为10 的作者的电话号码 res = models.Book.objects.filter(pk=10).first() for i in res.author.all(): print(i.author_detail.phone) res = models.Book.objects.filter(id=10).values('author__author_detail__phone') print(res) res = models.AuthorDetail.objects.filter(author__book__id=10).values('phone') print(res) ''' 使用双下划綫进行查询时,我们就不需要获取具体的数据对象,使用数据对象就类似于子查询,子查询还是比较low的, 双下划綫查询就类似于连表查询 使用双下划綫查询时,正向查找也是通过字段名,反向查找通过表名小写, 比如: 查询tank作者的手机号 正向查找 models.Author.objects.filter(name='tank').values('author_detail__phone') 通过字段名跳转到author_detail表中再通过两个下划线获得phone字段 反向查找 models.AuthorDetail.objects.filter(author__name='tank').values('phone') 我们可以直接在filter中进行跳转到author表中 我们在进行双下划綫查找时,脑中要有对应的sql语句,这样查找才可以更加便于理解Django的orm 比如上面的反向查找对应的sql语句: select phone from authordetail inner join author on (authordetail.author_id=author.id) where author.name='tank' values()中的数据理解为select后面的查找字段 filter()中的数据可以理解为where后面跟的查询条件 不管在values和filter中的跳转到另一张表,我们都可以理解为连表 比如: filter(author__name)这时候authordetail就已经和author两张表进行了内连 '''
聚合查询
from django.db.models import Max, Min, Sum, Count, Avg res = models.Book.objects.aggregate(Max('price')) print(res) res = models.Book.objects.aggregate(Sum('price')) print(res) res = models.Book.objects.aggregate(Min('price')) print(res) res = models.Book.objects.aggregate(Count('id')) print(res) res = models.Book.objects.aggregate(Avg('price')) print(res)
分组查询
from django.db.models import Max, Min, Sum, Count, Avg # 统计每一本书的作者个数 res = models.Book.objects.annotate(book_count=Count('author__id')).values('title', 'book_count') print(res) # 统计出每个出版社卖的最便宜的书的价格 res = models.Publish.objects.annotate(min_price=Min('book__price')).values('name', 'min_price') print(res) # 统计不止一个作者的图书 res = models.Book.objects.annotate(count_author=Count('author__id')).filter(count_author__gt=1).values('title') print(res) # 查询各个作者出的书的总价格 res = models.Author.objects.annotate(sum_price=Sum('book__price')).values('name','sum_price') print(res)
F与Q查询
# 查询库存数大于卖出数的书籍
# F查询应用场景:筛选出书籍表中库存数大于卖出数,我们之前的'__gt='后面跟的参数都是我们已经人为定好的,而现在我们需要从数据库中将一条条数据对应的卖出数取出,
# 这时候就需要F查询
from django.db.models import F, Q res = models.Book.objects.filter(kucun__gt=F('maichu')).values('title') print(res) from django.db.models.functions import Concat from django.db.models import Value res = models.Book.objects.update(title=Concat(F('title'), Value('新增')))
Concat表示进行字符串的拼接操作,参数位置决定了拼接是在头部拼接还是尾部拼接,Value里面是要新增的拼接值 print(res) res = models.Book.objects.filter(Q(title='围城'),Q(price=100)) # 用逗号隔开Q查询也代表and关系 res = models.Book.objects.filter(Q(title='围城')|Q(price=100)) # 用|隔开就代表or关系 res = models.Book.objects.filter(~Q(title='围城')) # ~波浪建就代表not print(res) q = Q() ''' q的高级使用,解决我们依据字符串进行查找,不再是title='jason',这种形式,而是类似于'title'='Jason' ''' q.children.append(('title', '围城')) q.children.append(('price__gt', 1000)) # q.children列表中多个查询条件时,默认是and关系 res = models.Book.objects.filter(q) # q对象可以放在filter里 print(res)
常见字段及自定义字段
常见字段 AutoField() int primary key auto_increment CharField() varchar() IntegerField() int() big.... EmailField() varchar(254) DateField() date DateTimeField() datetime auto_now:每次修改数据都会更新时间 auto_now_add:只在第一次创建数据的时候才会更新一次 BooleanField(Field) is_delete = BooleanField() 给该字段传值的时候 你只需要传布尔值即可 但是对应到数据库 它存的是0和1 TextField(Field) - 文本类型 用来存大段文本 FileField(Field) - 字符串,路径保存在数据库,文件上传到指定目录 - 参数: upload_to = "" 用户上传的文件会自动放到等号后面指定的文件路径中 storage = None 存储组件,默认django.core.files.storage.FileSystemStorage 自定义char字段 class MyChar(models.Field): def __init__(self,max_length,*args,**kwargs): self.max_length = max_length super().__init__(max_length=max_length,*args,**kwargs) def db_type(self, connection): return 'char(%s)'%self.max_length 外键字段 当你在使用django2.X版本的时候 在建立外键关系时(*****) 需要你手动添加几个关键点参数 models.cascade db_constraints
注意
我们在执行这句orm语句,Django并不会帮我们去操作数据库,因为Django是惰性查询,只有我们真正需要里面的数据时Django才会帮我们去查询,.比如print里面的数据时
我们使用all去跨表查询数据时,他会拿到每个作者id,
类似于SELECT `app01_authordetail`.`id`, `app01_authordetail`.`age`, `app01_authordetail`.`addr` FROM `app01_authordetail` WHERE `app01_authordetail`.`id` = 1
这种sql语句
如果我们要跨表查询1000条数据时,就会执行这种sql语句1000次,效率太低
def select_related(self, *fields) 性能相关:表之间进行join连表操作,一次性获取关联的数据。 总结: 1. select_related主要针一对一和多对一关系进行优化。 2. select_related使用SQL的JOIN语句进行优化,通过减少SQL查询的次数来进行优化、提高性能。 def prefetch_related(self, *lookups) 性能相关:多表连表操作时速度会慢,使用其执行多次SQL查询在Python代码中实现连表操作。 总结: 1. 对于多对多字段(ManyToManyField)和一对多字段,可以使用prefetch_related()来进行优化。 2. prefetch_related()的优化方式是分别查询每个表,然后用Python处理他们之间的关系。
# select_related与prefetch_related # select_related帮你直接连表操作 查询数据 括号内只能放外键字段 # res = models.Book.objects.all().select_related('publish') # for r in res: # print(r.publish.name) # res = models.Book.objects.all().select_related('publish__xxx__yyy__ttt') # print(res) # res = models.Book.objects.all() """ select_related:会将括号内外键字段所关联的那张表 直接全部拿过来(可以一次性拿多张表)跟当前表拼接操作 从而降低你跨表查询 数据库的压力 注意select_related括号只能放外键字段(一对一和一对多) res = models.Book.objects.all().select_related('外键字段1__外键字段2__外键字段3__外键字段4') """ # prefetch_related 不主动连表 res = models.Book.objects.prefetch_related('publish') """ 不主动连表操作(但是内部给你的感觉像是连表操作了) 而是将book表中的publish全部拿出来 在取publish表中将id对应的所有的数据取出 res = models.Book.objects.prefetch_related('publish') 括号内有几个外键字段 就会走几次数据库查询操作 """
only与defer
only与defer取出的数据并不像values取出的是字典的形式,而是一个个对象,我们可以for循环之后通过点语法取值
# res = models.Book.objects.only('title') # # print(res) # for r in res: # # print(r.title) # 只走一次数据库查询 # print(r.price) # 当你点击一个不是only括号内指定的字段的时候 不会报错 而是会频繁的走数据库查询 # res1 = models.Book.objects.defer('title') # defer与only是相反的 # for r in res1: # defer会将不是括号内的所有的字段信息 全部查询出来封装对象中 # # 一旦你点击了括号内的字段 那么会频繁的走数据库查询 # print(r.price)
事务
事务 ACID 原子性 一致性 隔离性 持久性 from django.db import transaction with transaction.atomic(): """数据库操作 在该代码块中书写的操作 同属于一个事务 """ models.Book.objects.create() models.Publish.objects.create() # 添加书籍和出版社 就是同一个事务 要么一起成功要么一起失败 print('出了 代码块 事务就结束')