Django框架-Django模型(models)系统之 ORM操作
Django ORM操作
一、一般操作
必知必会13条
<1> all(): 查询所有结果 <2> get(**kwargs): 返回与所给筛选条件相匹配的对象,返回结果有且只有一个,如果符合筛选条件的对象超过一个或者没有都会抛出错误。 <3> filter(**kwargs): 它包含了与所给筛选条件相匹配的对象 <4> exclude(**kwargs): 它包含了与所给筛选条件不匹配的对象 <5> values(*field): 返回一个ValueQuerySet——一个特殊的QuerySet,运行后得到的并不是一系列model的实例化对象,而是一个可迭代的字典序列 <6> values_list(*field): 它与values()非常相似,它返回的是一个元组序列,values返回的是一个字典序列 <7> order_by(*field): 对查询结果排序 <8> reverse(): 对查询结果反向排序,请注意reverse()通常只能在具有已定义顺序的QuerySet上调用(在model类的Meta中指定ordering或调用order_by()方法)。 <9> distinct(): 从返回结果中剔除重复纪录(如果你查询跨越多个表,可能在计算QuerySet时得到重复的结果。此时可以使用distinct(),注意只有在PostgreSQL中支持按字段去重。) <10> count(): 返回数据库中匹配查询(QuerySet)的对象数量。 <11> first(): 返回第一条记录 <12> last(): 返回最后一条记录 <13> exists(): 如果QuerySet包含数据,就返回True,否则返回False
返回QuerySet对象的方法有
all()
filter()
exclude()
order_by()
reverse()
distinct()
特殊的QuerySet
values() 返回一个可迭代的字典序列
values_list() 返回一个可迭代的元祖序列
返回具体对象的
get()
first()
last()
返回布尔值的方法有:
exists()
返回数字的方法有
count()
二、单表查询之神奇的双下划线
解决范围(>,<,>=,<=)的查询!
models.Tb1.objects.filter(id__lt=10, id__gt=1) # 获取id大于1 且 小于10的值
models.Tb1.objects.filter(id__in=[11, 22, 33]) # 获取id等于11、22、33的数据
models.Tb1.objects.exclude(id__in=[11, 22, 33]) # not in
models.Tb1.objects.filter(name__contains="ven") # 获取name字段包含"ven"的
models.Tb1.objects.filter(name__icontains="ven") # icontains大小写不敏感
models.Tb1.objects.filter(id__range=[1, 3]) # id范围是1到3的,等价于SQL的bettwen and
类似的还有:startswith,istartswith, endswith, iendswith
date字段还可以:
models.Class.objects.filter(first_day__year=2017)
models.Class.objects.filter(brith_year=2018,name_contains='ve')
三、ForeignKey操作
建类:-------------------models.py
from django.db import models
class Publisher(models.Model):
name = models.CharField(max_length=32, unique=True)
class Book(models.Model):
name = models.CharField(max_length=32, unique=True)
pubs = models.ForeignKey('Publisher')
class Person(models.Model):
id = models.AutoField(primary_key=True)
name = models.CharField(max_length=32)
age = models.IntegerField()
birth = models.DateField()
books = models.ManyToManyField('Book')
正向查找:多对一(设置了foreignKey一方开始查找另一表)
对象查找(跨表)
语法:
对象.关联字段.字段
示例:
book_obj = models.Book.objects.filter(id=1).first() # 获取第一本书对象
上面等同于models.Book.objects.first()
print(book_obj.pubs) # 得到这本书关联的出版社对象
print(book_obj.pubs.name) # 得到出版社对象的名称
字段查找(跨表)
语法:
关联字段__字段 注:双下划线
示例:
print(models.Book.objects.values_list("pubs__name"))
反向查找:一对多
对象查找
语法:
obj.表名_set 注:表名小写_set 即关联到对应表
示例:
ret_obj = models.Publisher.objects.filter(id=4).first() ret = ret_obj.book_set.all() # 出版社关联的所有书籍对象
print(ret_obj.book_set, type(ret_obj.book_set)) # 管理对象 login.Book.None <class 'django.db.models.fields.related_descriptors.create_reverse_many_to_one_manager.<locals>.RelatedManager'> print(ret) <QuerySet [<Book: cloud-南湖台州>]>
字段查找
语法:
表名__字段
示例:
ret = models.Publisher.objects.filter(book__id=5)
注:表名都需要小写
扩展:
如反向查询,不想book_set等写法,可以在models的类中属性约束加入‘related_name’ 即
pubs = models.ForeignKey('Publisher', related_name='books')
之后反向查询就不用表名关联了,需要也只能用配置的别名来操作。
四、多表查询之ManyToManyField
class RelatedManager
"关联管理器" 是在一对多或者多对多的关联上下文中使用的管理器。
它存在于下面两种情况:
1、外键关系的反向查询
2、多对多关联关系
简单来说就是当 点后面的对象 可能存在多个的时候就可以使用一下的方法。
常用方法
create()
创建一个新的对象,保存对象,并将它添加到关联对象集之中,返回新创建的对象
# 为序号为第一个人添加写得书的对象,添加一本书‘活着’
models.Person.objects.first().book_set.create(name='活着')
add()
把指定的model对象添加到关联对象集中
添加对象
# 查询id号小于3的人的对象
per_obj = models.Person.objects.filter(id__lt=3)
# 书添加人,反向,那么就需要 人表_set
ret = models.Book.objects.last().person_set.add(per_obj)
# 正向人加书
ret = models.Person.objects.filter(id=3).first().books.add()
添加id,可以是一个,也可以是多个,多个需要通过*打散
models.Book.objects.first().person_set.add(*[1,2,3])
set()
更新model对象的关联对象
book_obj = models.Book.objects.first()
book_obj.person_set.set([2,3,4])
remove()
从关联对象集中移除执行的model对象
# 删除写书的作者中的一位
book_obj = models.Book.objects.get(id=3)
book_obj.person_set.remove(3)
clear()
从关联对象集中移除一切对象,清空。
# 将写书的作者都删掉
book_obj= models.Book.objects.first()
book_obj.person_set().clear()
注:
1、对于外键对象,clear()和remove()方法仅在null=True时存在。
2、对于所有类型的关联字段,add()、create()、remove()、clear() 、set() 都会马上更新数据库,换句话说,在关联的任何一端,都不需要再调用save()方法。
3、对于改变单表未关联其它表的字段,需要使用save()一下。
per_obj.name = new_name
per_obj.save()
五、聚合查询和分组查询
聚合查询:即mysql中的聚合函数sum(),count(),avg()...
aggregate()是querySet的一个终止子句,意思即,它返回一个包含一些键值对的字典。
键的名称是聚合值的标识符,值是计算出来得聚合值。键的名称是按照字段和聚合函数的名称自动生成出来的。
用到的内置函数:
from django.db.models import Avg,Sum,Max,Min,Count
eg:
所有的聚合都是先查询出满足条件的一张虚拟表,然后调用聚合函数
返回的是一个字典
models.Book.objects.all().aggregate(Avg('id'))
{'id__avg': Decimal('10009.5000')}
如果你想为聚合值指定一个名称,可以向聚合子句提供它,即sql里的设置别名。
models.Book.objects.all().aggregate(自定义的别名=Sum('id'))
可以同时应用多个聚合查询,即向aggregate()子句中添加另一个参数。
models.Book.objects.all().aggregate(Avg('price'), Max('price'),Min('price'))
{'price__avg': 13.233333, 'price__max': Decimal('19.90'), 'price__min': Decimal('9.90')}
分组:即mydql中的group_by,使用annotate()方法
我们在这里先复习一下SQL语句的分组。
假设现在有一张公司职员表:
我们使用原生SQL语句,按照部门分组求平均工资:
select dept,AVG(salary) from employee group by dept;
ORM查询:
from django.db.models import Avg Employee.objects.values("dept").annotate(avg=Avg("salary")).values("dept", "avg")
连表查询的分组:
SQL查询:
select dept.name,AVG(salary) from employee inner join dept on (employee.dept_id=dept.id) group by dept_id;
ORM查询:
from django.db.models import Avg models.Dept.objects.all().annotate(avg=Avg("employee__salary")).values("name", "avg")
eg1、统计每一本书的作者个数
book_list = models.Book.objects.all().annotate(author_num=Count('author')) -->queryset
for obj in book_list:
print(obj.author_num end=';') 2;1;1……
# 先通过count里的author字段进行分组,然后再调用count方法计数
eg2、统计出每个出版社买的最便宜的书的价格
answer1:
pub_list = models.Publisher.objects.annotate(min_price=Min('book__price'))
for obj in pub_list:
print(obj.min_price)
book__price :book表中的price字段
answer2:反向
models.Book.objects.values('publisher__name').annotate(min_price=Min('price'))
eg3、统计不止一个作者的图书
models.Book.objects.annotate(author_num=Count('author')).filter(author_num__gt=1)
eg4、根据一本图书作者数量的多少对查询集QuerSet进行排序
models.Book.objects.annotate(author_num=Count('author')).order_by('author_num')
eg5、查询各个作者出的书的总价格
models.Author.objects.annotate(sum_price=Sum('book__price')).values('name','sum_price')
.小结:分组查询,不管是关联字段反向查询,还是正向查询,前面部分都是先分组,后面是对分组后的数据进行二次整理。
六、F查询和Q查询
上面的过滤查询都只是将字段值与某各常量做比较,不能进行如表中两个字段的值的比较,这时就需用到F查询。
from django.db.models import F,Q
F查询
Django提供F()方法来做这样的比较,F()的实例可以再查询中引用字段,来比较同一个model实例中两个不同字段的值。
eg1、查询评论数大于收藏数的书籍
from django.db.models import F
models.Book.objects.filter(commnet_num__gt=F('keep_num'))
Django 支持F()对象之间以及F()对象和常数之间的加减乘除和取模的操作
models.Book.objects.filter(comment_num__lt=F('keep_num')*2)
修改操作也可以使用F函数,比如将每一本数书的价格提高30元
models.Book.objects.all().update(price=F('price')+30)
详解增加表数据:
注意:
<1> 第二种方式修改不能用get的原因是:update是QuerySet对象的方法,get返回的是一个model对象,它没有update方法,而filter返回的是一个QuerySet对象(filter里面的条件可能有多个条件符合,比如name='alvin',可能有两个name='alvin'的行数据)。
<2>models模型的save()方法,这个方法会更新一行里的所有列。 而某些情况下,我们只需要更新行里的某几列,update效率更高。
此外,update()方法对于任何结果集(QuerySet)均有效,这意味着你可以同时更新多条记录update()方法会返回一个整型数值,表示受影响的记录条数。
注意,这里因为update返回的是一个整形,所以没法用query属性;对于每次创建一个对象,想显示对应的raw sql,需要在settings加上日志记录部分
Q查询:
filter() 等方法中的关键字参数查询都是一起进行“AND” 的。 如果你需要执行更复杂的查询(例如OR 语句),你可以使用Q 对象。
1、查询id大于1并且评论数大于100的书
print(models.Book.objects.filter(nid__gt=1,commentNum__gt=100)) print(models.Book.objects.filter(nid__gt=1).filter(commentNum__gt=100)) print(models.Book.objects.filter(Q(nid__gt=1)&Q(commentNum__gt=100)))
2、查询评论数大于100或者阅读数小于200的书
print(models.Book.objects.filter(Q(commentNum__gt=100)|Q(readNum__lt=200)))
Q 对象可以使用& 和| 操作符组合起来。当一个操作符在两个Q 对象上使用时,它产生一个新的Q 对象。
3、查询年份等于2017年或者价格大于200的书
print(models.Book.objects.filter(Q(publishDdata__year=2017)|Q(price__gt=200)))
4、查询年份不是2017年或者价格大于200的书
print(models.Book.objects.filter(~Q(publishDdata__year=2017)&Q(price__gt=200)))
注意:
查询函数可以混合使用Q 对象和关键字参数。所有提供给查询函数的参数(关键字参数或Q 对象)都将"AND”在一起。但是,如果出现Q 对象,它必须位于所有关键字参数的前面。例如:
bookList=models.Book.objects.filter(Q(publishDate__year=2016) | Q(publishDate__year=2017),title__icontains="python")
七、事务
import os
if __name__ == '__main__':
os.environ.setdefault("DJANGO_SETTINGS_MODULE", "BMS.settings")
import django
django.setup()
import datetime
from app01 import models
try:
from django.db import transaction
with transaction.atomic():
new_publisher = models.Publisher.objects.create(name="xx出版社")
models.Book.objects.create(title="人生苦短", publish_date=datetime.date.today(), publisher_id=10) # 指定一个不存在的出版社id
except Exception as e:
print(str(e))
注:事务就是解决事件的安全性,保证多个sql操作全部完成才写入数据库,如银行转账,必须a账户减少了前,b账户整加了对应的数,才写入数据库,如中间出错,将回滚,不会写入库中,保证事件有始有终。
八、扩展提升内容:
Django ORM执行原生sql
1 # extra 2 # 在QuerySet的基础上继续执行子语句 3 # extra(self, select=None, where=None, params=None, tables=None, order_by=None, select_params=None) 4 5 # select和select_params是一组,where和params是一组,tables用来设置from哪个表 6 # Entry.objects.extra(select={'new_id': "select col from sometable where othercol > %s"}, select_params=(1,)) 7 # Entry.objects.extra(where=['headline=%s'], params=['Lennon']) 8 # Entry.objects.extra(where=["foo='a' OR bar = 'a'", "baz = 'a'"]) 9 # Entry.objects.extra(select={'new_id': "select id from tb where id > %s"}, select_params=(1,), order_by=['-nid']) 10 11 举个例子: 12 models.UserInfo.objects.extra( 13 select={'newid':'select count(1) from app01_usertype where id>%s'}, 14 select_params=[1,], 15 where = ['age>%s'], 16 params=[18,], 17 order_by=['-age'], 18 tables=['app01_usertype'] 19 ) 20 """ 21 select 22 app01_userinfo.id, 23 (select count(1) from app01_usertype where id>1) as newid 24 from app01_userinfo,app01_usertype 25 where 26 app01_userinfo.age > 18 27 order by 28 app01_userinfo.age desc 29 """ 30 31 32 # 执行原生SQL 33 # 更高灵活度的方式执行原生SQL语句 34 # from django.db import connection, connections 35 # cursor = connection.cursor() # cursor = connections['default'].cursor() 36 # cursor.execute("""SELECT * from auth_user where id = %s""", [1]) 37 # row = cursor.fetchone()
1.使用extra方法 解释:结果集修改器,一种提供额外查询参数的机制 说明:依赖model模型 用在where后: Book.objects.filter(publisher_id="1").extra(where=["title='python学习1'"]) 用在select后 Book.objects.filter(publisher_id="1").extra(select={"count":"select count(*) from hello_book"}) 2.使用raw方法 解释:执行原始sql并返回模型 说明:依赖model多用于查询 用法: book = Book.objects.raw("select * from hello_book") for item in book: print(item.title) 3.执行自定义SQL 解释:利用游标执行 导入:from django.db import connection 说明:不依赖model 用法: from django.db import connection cursor = connection.cursor() #插入 cursor.execute("insert into hello_author(name) values('xiaol')") #更新 cursor.execute("update hello_author set name='xiaol' where id=1") #删除 cursor.execute("delete from hello_author where name='xiaol'") #查询 cursor.execute("select * from hello_author") #返回一行 raw = cursor.fetchone() print(raw) # #返回所有 # cursor.fetchall()
QuerySet方法大全
##################################################################
# PUBLIC METHODS THAT ALTER ATTRIBUTES AND RETURN A NEW QUERYSET #
##################################################################
def all(self)
# 获取所有的数据对象
def filter(self, *args, **kwargs)
# 条件查询
# 条件可以是:参数,字典,Q
def exclude(self, *args, **kwargs)
# 条件查询
# 条件可以是:参数,字典,Q
def select_related(self, *fields)
性能相关:表之间进行join连表操作,一次性获取关联的数据。
总结:
1. select_related主要针一对一和多对一关系进行优化。
2. select_related使用SQL的JOIN语句进行优化,通过减少SQL查询的次数来进行优化、提高性能。
def prefetch_related(self, *lookups)
性能相关:多表连表操作时速度会慢,使用其执行多次SQL查询在Python代码中实现连表操作。
总结:
1. 对于多对多字段(ManyToManyField)和一对多字段,可以使用prefetch_related()来进行优化。
2. prefetch_related()的优化方式是分别查询每个表,然后用Python处理他们之间的关系。
def annotate(self, *args, **kwargs)
# 用于实现聚合group by查询
from django.db.models import Count, Avg, Max, Min, Sum
v = models.UserInfo.objects.values('u_id').annotate(uid=Count('u_id'))
# SELECT u_id, COUNT(ui) AS `uid` FROM UserInfo GROUP BY u_id
v = models.UserInfo.objects.values('u_id').annotate(uid=Count('u_id')).filter(uid__gt=1)
# SELECT u_id, COUNT(ui_id) AS `uid` FROM UserInfo GROUP BY u_id having count(u_id) > 1
v = models.UserInfo.objects.values('u_id').annotate(uid=Count('u_id',distinct=True)).filter(uid__gt=1)
# SELECT u_id, COUNT( DISTINCT ui_id) AS `uid` FROM UserInfo GROUP BY u_id having count(u_id) > 1
def distinct(self, *field_names)
# 用于distinct去重
models.UserInfo.objects.values('nid').distinct()
# select distinct nid from userinfo
注:只有在PostgreSQL中才能使用distinct进行去重
def order_by(self, *field_names)
# 用于排序
models.UserInfo.objects.all().order_by('-id','age')
def extra(self, select=None, where=None, params=None, tables=None, order_by=None, select_params=None)
# 构造额外的查询条件或者映射,如:子查询
Entry.objects.extra(select={'new_id': "select col from sometable where othercol > %s"}, select_params=(1,))
Entry.objects.extra(where=['headline=%s'], params=['Lennon'])
Entry.objects.extra(where=["foo='a' OR bar = 'a'", "baz = 'a'"])
Entry.objects.extra(select={'new_id': "select id from tb where id > %s"}, select_params=(1,), order_by=['-nid'])
def reverse(self):
# 倒序
models.UserInfo.objects.all().order_by('-nid').reverse()
# 注:如果存在order_by,reverse则是倒序,如果多个排序则一一倒序
def defer(self, *fields):
models.UserInfo.objects.defer('username','id')
或
models.UserInfo.objects.filter(...).defer('username','id')
#映射中排除某列数据
def only(self, *fields):
#仅取某个表中的数据
models.UserInfo.objects.only('username','id')
或
models.UserInfo.objects.filter(...).only('username','id')
def using(self, alias):
指定使用的数据库,参数为别名(setting中的设置)
##################################################
# PUBLIC METHODS THAT RETURN A QUERYSET SUBCLASS #
##################################################
def raw(self, raw_query, params=None, translations=None, using=None):
# 执行原生SQL
models.UserInfo.objects.raw('select * from userinfo')
# 如果SQL是其他表时,必须将名字设置为当前UserInfo对象的主键列名
models.UserInfo.objects.raw('select id as nid from 其他表')
# 为原生SQL设置参数
models.UserInfo.objects.raw('select id as nid from userinfo where nid>%s', params=[12,])
# 将获取的到列名转换为指定列名
name_map = {'first': 'first_name', 'last': 'last_name', 'bd': 'birth_date', 'pk': 'id'}
Person.objects.raw('SELECT * FROM some_other_table', translations=name_map)
# 指定数据库
models.UserInfo.objects.raw('select * from userinfo', using="default")
################### 原生SQL ###################
from django.db import connection, connections
cursor = connection.cursor() # cursor = connections['default'].cursor()
cursor.execute("""SELECT * from auth_user where id = %s""", [1])
row = cursor.fetchone() # fetchall()/fetchmany(..)
def values(self, *fields):
# 获取每行数据为字典格式
def values_list(self, *fields, **kwargs):
# 获取每行数据为元祖
def dates(self, field_name, kind, order='ASC'):
# 根据时间进行某一部分进行去重查找并截取指定内容
# kind只能是:"year"(年), "month"(年-月), "day"(年-月-日)
# order只能是:"ASC" "DESC"
# 并获取转换后的时间
- year : 年-01-01
- month: 年-月-01
- day : 年-月-日
models.DatePlus.objects.dates('ctime','day','DESC')
def datetimes(self, field_name, kind, order='ASC', tzinfo=None):
# 根据时间进行某一部分进行去重查找并截取指定内容,将时间转换为指定时区时间
# kind只能是 "year", "month", "day", "hour", "minute", "second"
# order只能是:"ASC" "DESC"
# tzinfo时区对象
models.DDD.objects.datetimes('ctime','hour',tzinfo=pytz.UTC)
models.DDD.objects.datetimes('ctime','hour',tzinfo=pytz.timezone('Asia/Shanghai'))
"""
pip3 install pytz
import pytz
pytz.all_timezones
pytz.timezone(‘Asia/Shanghai’)
"""
def none(self):
# 空QuerySet对象
####################################
# METHODS THAT DO DATABASE QUERIES #
####################################
def aggregate(self, *args, **kwargs):
# 聚合函数,获取字典类型聚合结果
from django.db.models import Count, Avg, Max, Min, Sum
result = models.UserInfo.objects.aggregate(k=Count('u_id', distinct=True), n=Count('nid'))
===> {'k': 3, 'n': 4}
def count(self):
# 获取个数
def get(self, *args, **kwargs):
# 获取单个对象
def create(self, **kwargs):
# 创建对象
def bulk_create(self, objs, batch_size=None):
# 批量插入
# batch_size表示一次插入的个数
objs = [
models.DDD(name='r11'),
models.DDD(name='r22')
]
models.DDD.objects.bulk_create(objs, 10)
def get_or_create(self, defaults=None, **kwargs):
# 如果存在,则获取,否则,创建
# defaults 指定创建时,其他字段的值
obj, created = models.UserInfo.objects.get_or_create(username='root1', defaults={'email': '1111111','u_id': 2, 't_id': 2})
def update_or_create(self, defaults=None, **kwargs):
# 如果存在,则更新,否则,创建
# defaults 指定创建时或更新时的其他字段
obj, created = models.UserInfo.objects.update_or_create(username='root1', defaults={'email': '1111111','u_id': 2, 't_id': 1})
def first(self):
# 获取第一个
def last(self):
# 获取最后一个
def in_bulk(self, id_list=None):
# 根据主键ID进行查找
id_list = [11,21,31]
models.DDD.objects.in_bulk(id_list)
def delete(self):
# 删除
def update(self, **kwargs):
# 更新
def exists(self):
# 是否有结果
Django终端打印SQL语句
在Django项目的settings.py文件中,在最后复制粘贴如下代码:
LOGGING = {
'version': 1,
'disable_existing_loggers': False,
'handlers': {
'console':{
'level':'DEBUG',
'class':'logging.StreamHandler',
},
},
'loggers': {
'django.db.backends': {
'handlers': ['console'],
'propagate': True,
'level':'DEBUG',
},
}
}
即为你的Django项目配置上一个名为django.db.backends的logger实例即可查看翻译后的SQL语句。
在Python脚本中调用Django环境
# 在应用的目录下建立一个py文件,将下面的代码写入
import os
if __name__ == '__main__':
os.environ.setdefault("DJANGO_SETTINGS_MODULE", "项目的名字.settings")
import django
django.setup()
from 应用的名字 import models
'''所有的orm操作写在此处'''