数据库
目标
- MySQL 相关软件
- 操作数据库
- ORM模型
- 模型常用字段
- 外键和表关系
- 查询操作
- QuerySet API
- ORM练习
- ORM模型迁移
- Pycharm 配置连接数据库
一 MySQL 相关软件
1-1 MySQL 数据库
在网站开发中,数据库是网站的重要组成部分。只有提供数据库,数据才能够动态的展示,而不是在网页中显示一个静态的页面。数据库有很多,比如有SQL Server
、Oracle
、PostgreSQL
以及MySQL
等等。MySQL
由于价格实惠、简单易用、不受平台限制、灵活度高等特性,目前已经取得了绝大多数的市场份额。因此我们在Django
中,也是使用MySQL
来作为数据存储。
MySQL数据库安装
1)在MySQL
的官网下载MySQL
数据库安装文件:https://dev.mysql.com/downloads/windows/installer/5.7.html
2)然后双击安装,如果出现以下错误,则到http://www.microsoft.com/en-us/download/details.aspx?id=17113
下载.net framework
3)在安装过程中,如果提示没有Microsoft C++ 2013
,那么就到以下网址下载安装即可:http://download.microsoft.com/download/9/0/5/905DBD86-D1B8-4D4B-8A50-CB0E922017B9/vcredist_x64.exe
4)接下来就是做好用户名和密码的配置即可。
navicat数据库操作软件
安装完MySQL
数据库以后,就可以使用MySQL
提供的终端客户端软件来操作数据库。如下:
这个软件所有的操作都是基于sql
语言,对于想要熟练sql
语言的同学来讲是非常合适的。但是对于在企业中可能不是一款好用的工具。在企业中我们推荐使用mysql workbench
以及navicat
这种图形化操作的软件。而mysql workbench
是mysql
官方提供的一个免费的软件,正因为是免费,所以在一些功能上不及navicat
。navicat for mysql
是一款收费的软件。官网地址如下:https://www.navicat.com.cn/products
。使用的截图如下:
MySQL驱动程序安装
我们使用Django
来操作MySQL
,实际上底层还是通过Python
来操作的。因此我们想要用Django
来操作MySQL
,首先还是需要安装一个驱动程序。在Python3
中,驱动程序有多种选择。比如有pymysql
以及mysqlclient
等。这里我们就使用mysqlclient
来操作。mysqlclient
安装非常简单。只需要通过pip install mysqlclient
即可安装。
常见MySQL
驱动介绍:
- MySQL-python:也就是
MySQLdb
。是对C
语言操作MySQL
数据库的一个简单封装。遵循了Python DB API v2
。但是只支持Python2
,目前还不支持Python3
。 - mysqlclient:是
MySQL-python
的另外一个分支。支持Python3
并且修复了一些bug
。 - pymsql:纯
Python
实现的一个驱动。因为是纯Python
编写的,因此执行效率不如MySQL-python
。并且也因为是纯Python
编写的,因此可以和Python
代码无缝衔接。 - MySQL Connector/Python:
MySQL
官方推出的使用纯Python
连接MySQL
的驱动。因为是纯Python
开发的。效率不高。
二 操作数据库
2-1 Django配置连接数据库
在操作数据库之前,首先先要连接数据库。这里我们以配置MySQL
为例来讲解。Django
连接数据库,不需要单独的创建一个连接对象。只需要在settings.py
文件中做好数据库相关的配置就可以了。示例代码如下:
DATABASES = { 'default': { # 数据库引擎(是mysql还是oracle等) 'ENGINE': 'django.db.backends.mysql', # 数据库的名字 'NAME': 'dfz', # 连接mysql数据库的用户名 'USER': 'root', # 连接mysql数据库的密码 'PASSWORD': 'root', # mysql数据库的主机地址 'HOST': '127.0.0.1', # mysql数据库的端口号 'PORT': '3306' } }
2-2 在Django中操作数据库
1、在Django
中操作数据库有两种方式。第一种方式就是使用原生sql
语句操作,第二种就是使用ORM
模型来操作。这节课首先来讲下第一种。
2、在Django
中使用原生sql
语句操作其实就是使用python db api
的接口来操作。如果你的mysql
驱动使用的是pymysql
,那么你就是使用pymysql
来操作的,只不过Django
将数据库连接的这一部分封装好了,我们只要在settings.py
中配置好了数据库连接信息后直接使用Django
封装好的接口就可以操作了。示例代码如下:
# 使用django封装好的connection对象,会自动读取settings.py中数据库的配置信息 from django.db import connection # 获取游标对象 cursor = connection.cursor() # 拿到游标对象后执行sql语句 cursor.execute("select * from book") # 获取所有的数据 rows = cursor.fetchall() # 遍历查询到的数据 for row in rows: print(row)
以上的execute
以及fetchall
方法都是Python DB API
规范中定义好的。任何使用Python
来操作MySQL
的驱动程序都应该遵循这个规范。所以不管是使用pymysql
或者是mysqlclient
或者是mysqldb
,他们的接口都是一样的。更多规范请参考:https://www.python.org/dev/peps/pep-0249/
2-3 Python DB API下规范下cursor对象常用接口
- description:如果
cursor
执行了查询的sql
代码。那么读取cursor.description
属性的时候,将返回一个列表,这个列表中装的是元组,元组中装的分别是(name,type_code,display_size,internal_size,precision,scale,null_ok)
,其中name
代表的是查找出来的数据的字段名称,其他参数暂时用处不大。 - rowcount:代表的是在执行了
sql
语句后受影响的行数。 - close:关闭游标。关闭游标以后就再也不能使用了,否则会抛出异常。
- execute(sql[,parameters]):执行某个
sql
语句。如果在执行sql
语句的时候还需要传递参数,那么可以传给parameters
参数。示例代码如下:
cursor.execute("select * from article where id=%s",(1,))
- fetchone:在执行了查询操作以后,获取第一条数据。
- fetchmany(size):在执行查询操作以后,获取多条数据。具体是多少条要看传的
size
参数。如果不传size
参数,那么默认是获取第一条数据。 - fetchall:获取所有满足
sql
语句的数据。
三 ORM 模型
3-1 ORM模型介绍
1、随着项目越来越大,采用写原生SQL的方式在代码中会出现大量的SQL语句,那么问题就出现了:
- SQL语句重复利用率不高,越复杂的SQL语句条件越多,代码越长。会出现很多相近的SQL语句。
- 很多SQL语句是在业务逻辑中拼出来的,如果有数据库需要更改,就要去修改这些逻辑,这会很容易漏掉对某些SQL语句的修改。
- 写SQL时容易忽略web安全问题,给未来造成隐患。SQL注入。
2、ORM
,全称Object Relational Mapping
,中文叫做对象关系映射,通过ORM
我们可以通过类的方式去操作数据库,而不用再写原生的SQL语句。通过把表映射成类,把行作实例,把字段作为属性,ORM
在执行对象操作的时候最终还是会把对应的操作转换为数据库原生语句。使用ORM
有许多优点:
- 易用性:使用
ORM
做数据库的开发可以有效的减少重复SQL语句的概率,写出来的模型也更加直观、清晰。 - 性能损耗小:
ORM
转换成底层数据库操作指令确实会有一些开销。但从实际的情况来看,这种性能损耗很少(不足5%),只要不是对性能有严苛的要求,综合考虑开发效率、代码的阅读性,带来的好处要远远大于性能损耗,而且项目越大作用越明显。 - 设计灵活:可以轻松的写出复杂的查询。
- 可移植性:
Django
封装了底层的数据库实现,支持多个关系数据库引擎,包括流行的MySQL
、PostgreSQL
和SQLite
。可以非常轻松的切换数据库。
3-2 创建ORM模型
1、ORM
模型一般都是放在app
的models.py
文件中。每个app
都可以拥有自己的模型。并且如果这个模型想要映射到数据库中,那么这个app
必须要放在settings.py
的INSTALLED_APP
中进行安装。以下是写一个简单的书籍ORM
模型。示例代码如下:
from django.db import models class Book(models.Model): name = models.CharField(max_length=20,null=False) author = models.CharField(max_length=20,null=False) pub_time = models.DateTimeField(default=datetime.now) price = models.FloatField(default=0)
以上便定义了一个模型。这个模型继承自django.db.models.Model
,如果这个模型想要映射到数据库中,就必须继承自这个类。这个模型以后映射到数据库中,表名是模型名称的小写形式,为book
。在这个表中,有四个字段,一个为name
,这个字段是保存的是书的名称,是varchar
类型,最长不能超过20个字符,并且不能为空。第二个字段是作者名字类型,同样也是varchar
类型,长度不能超过20个。第三个是出版时间,数据类型是datetime
类型,默认是保存这本书籍的时间。第五个是这本书的价格,是浮点类型。
还有一个字段我们没有写,就是主键id
,在django
中,如果一个模型没有定义主键,那么将会自动生成一个自动增长的int
类型的主键,并且这个主键的名字就叫做id
。
3-3 映射模型到数据库中
1、将ORM
模型映射到数据库中,总结起来就是以下几步:
- 在
settings.py
中,配置好DATABASES,做好数据库相关的配置。 - 在
app
中的models.py
中定义好模型,这个模型必须继承自django.db.models
。 - 将这个
app
添加到settings.py
的INSTALLED_APP
中。 - 在命令行终端,进入到项目所在的路径,然后执行命令
python manage.py makemigrations
来生成迁移脚本文件。 - 同样在命令行中,执行命令
python manage.py migrate
来将迁移脚本文件映射到数据库中。
3-4模型中 Meta 配置
1、对于一些模型级别的配置。我们可以在模型中定义一个类,叫做Meta
。然后在这个类中添加一些类属性来控制模型的作用。比如我们想要在数据库映射的时候使用自己指定的表名,而不是使用模型的名称。那么我们可以在Meta
类中添加一个db_table
的属性。示例代码如下:
class Book(models.Model): name = models.CharField(max_length=20,null=False) desc = models.CharField(max_length=100,name='description',db_column="description1") class Meta: db_table = 'book_model'
2、以下将对Meta
类中的一些常用配置进行解释。
- db_table:这个模型映射到数据库中的表名。如果没有指定这个参数,那么在映射的时候将会使用模型名来作为默认的表名。
- ordering:设置在提取数据的排序方式。后面章节会讲到如何查找数据。比如我想在查找数据的时候根据添加的时间排序,那么示例代码如下:
class Book(models.Model): name = models.CharField(max_length=20,null=False) desc = models.CharField(max_length=100,name='description',db_column="description1") pub_date = models.DateTimeField(auto_now_add=True) class Meta: db_table = 'book_model' ordering = ['pub_date']
更多的配置请参考官方文档:https://docs.djangoproject.com/en/2.0/ref/models/options/
四 模型常用属性
1、常用字段:在Django
中,定义了一些Field
来与数据库表中的字段类型来进行映射。以下将介绍那些常用的字段类型。
- AutoField:映射到数据库中是
int
类型,可以有自动增长的特性。一般不需要使用这个类型,如果不指定主键,那么模型会自动的生成一个叫做id
的自动增长的主键。如果你想指定一个其他名字的并且具有自动增长的主键,使用AutoField
也是可以的。 - BigAutoField:64位的整型,类似于
AutoField
,只不过是产生的数据的范围是从1-9223372036854775807
。 - IntegerField:整型。值的区间是
-2147483648——2147483647
。 - BigIntegerField:大整型。值的区间是
-9223372036854775808——9223372036854775807
。 - PositiveIntegerField:正整型。值的区间是
0——2147483647
。 - SmallIntegerField:小整型。值的区间是
-32768——32767
。 - PositiveSmallIntegerField:正小整型。值的区间是
0——32767
。 - BooleanField:在模型层面接收的是
True/False
。在数据库层面是tinyint
类型。如果没有指定默认值,默认值是None
。 - CharField:在数据库层面是
varchar
类型。在Python
层面就是普通的字符串。这个类型在使用的时候必须要指定最大的长度,也即必须要传递max_length
这个关键字参数进去。 - DateField:日期类型。在
Python
中是datetime.date
类型,可以记录年月日。在映射到数据库中也是date
类型。使用这个Field
可以传递以下几个参数:- auto_now:在每次这个数据保存的时候,都使用当前的时间。比如作为一个记录修改日期的字段,可以将这个属性设置为
True
。 - auto_now_add:在每次数据第一次被添加进去的时候,都使用当前的时间。比如作为一个记录第一次入库的字段,可以将这个属性设置为
True
。
- auto_now:在每次这个数据保存的时候,都使用当前的时间。比如作为一个记录修改日期的字段,可以将这个属性设置为
- DateTimeField:日期时间类型,类似于
DateField
。不仅仅可以存储日期,还可以存储时间。映射到数据库中是datetime
类型。这个Field
也可以使用auto_now
和auto_now_add
两个属性。 - TimeField:时间类型。在数据库中是
time
类型。在Python
中是datetime.time
类型。 - EmailField:类似于
CharField
。在数据库底层也是一个varchar
类型。最大长度是254个字符。 - FileField:用来存储文件的。这个请参考后面的文件上传章节部分。
- ImageField:用来存储图片文件的。这个请参考后面的图片上传章节部分。
- FloatField:浮点类型。映射到数据库中是
float
类型。 - TextField:大量的文本类型。映射到数据库中是longtext类型。
- UUIDField:只能存储
uuid
格式的字符串。uuid
是一个32位的全球唯一的字符串,一般用来作为主键。 - URLField:类似于
CharField
,只不过只能用来存储url
格式的字符串。并且默认的max_length
是200。
2、Field的常用参数
- null:如果设置为
True
,Django
将会在映射表的时候指定是否为空。默认是为False
。在使用字符串相关的Field
(CharField/TextField)的时候,官方推荐尽量不要使用这个参数,也就是保持默认值False
。因为Django
在处理字符串相关的Field
的时候,即使这个Field
的null=False
,如果你没有给这个Field
传递任何值,那么Django
也会使用一个空的字符串""
来作为默认值存储进去。因此如果再使用null=True
,Django
会产生两种空值的情形(NULL或者空字符串)。如果想要在表单验证的时候允许这个字符串为空,那么建议使用blank=True
。如果你的Field
是BooleanField
,那么对应的可空的字段则为NullBooleanField
。 - blank:标识这个字段在表单验证的时候是否可以为空。默认是
False
。
这个和null
是有区别的,null
是一个纯数据库级别的。而blank
是表单验证级别的。 - db_column:这个字段在数据库中的名字。如果没有设置这个参数,那么将会使用模型中属性的名字。
- default:默认值。可以为一个值,或者是一个函数,但是不支持
lambda
表达式。并且不支持列表/字典/集合等可变的数据结构。 - primary_key:是否为主键。默认是
False
。 - unique:在表中这个字段的值是否唯一。一般是设置手机号码/邮箱等。
更多Field
参数请参考官方文档:https://docs.djangoproject.com/zh-hans/2.0/ref/models/fields/
五 外键和表关系
5-1 外键
1、在MySQL
中,表有两种引擎,一种是InnoDB
,另外一种是myisam
。如果使用的是InnoDB
引擎,是支持外键约束的。外键的存在使得ORM
框架在处理表关系的时候异常的强大。因此这里我们首先来介绍下外键在Django
中的使用。
2、类定义为class ForeignKey(to,on_delete,**options)
。第一个参数是引用的是哪个模型,第二个参数是在使用外键引用的模型数据被删除了,这个字段该如何处理,比如有CASCADE
、SET_NULL
等。这里以一个实际案例来说明。比如有一个User
和一个Article
两个模型。一个User
可以发表多篇文章,一个Article
只能有一个Author
,并且通过外键进行引用。那么相关的示例代码如下:
class User(models.Model): username = models.CharField(max_length=20) password = models.CharField(max_length=100) class Article(models.Model): title = models.CharField(max_length=100) content = models.TextField() author = models.ForeignKey("User",on_delete=models.CASCADE)
以上使用ForeignKey
来定义模型之间的关系。即在article
的实例中可以通过author
属性来操作对应的User
模型。这样使用起来非常的方便。示例代码如下:
article = Article(title='abc',content='123') author = User(username='张三',password='111111') article.author = author article.save() # 修改article.author上的值 article.author.username = '李四' article.save()
为什么使用了ForeignKey
后,就能通过author
访问到对应的user
对象呢。因为在底层,Django
为Article
表添加了一个属性名_id
的字段(比如author的字段名称是author_id),这个字段是一个外键,记录着对应的作者的主键。以后通过article.author
访问的时候,实际上是先通过author_id
找到对应的数据,然后再提取User
表中的这条数据,形成一个模型。
3、如果想要引用另外一个app
的模型,那么应该在传递to
参数的时候,使用app.model_name
进行指定。以上例为例,如果User
和Article
不是在同一个app
中,那么在引用的时候的示例代码如下:
# User模型在user这个app中 class User(models.Model): username = models.CharField(max_length=20) password = models.CharField(max_length=100) # Article模型在article这个app中 class Article(models.Model): title = models.CharField(max_length=100) content = models.TextField() author = models.ForeignKey("user.User",on_delete=models.CASCADE)
4、如果模型的外键引用的是本身自己这个模型,那么to
参数可以为'self'
,或者是这个模型的名字。在论坛开发中,一般评论都可以进行二级评论,即可以针对另外一个评论进行评论,那么在定义模型的时候就需要使用外键来引用自身。示例代码如下:
class Comment(models.Model): content = models.TextField() origin_comment = models.ForeignKey('self',on_delete=models.CASCADE,null=True) # 或者 # origin_comment = models.ForeignKey('Comment',on_delete=models.CASCADE,null=True)
5-2 外键删除操作
如果一个模型使用了外键。那么在对方那个模型被删掉后,该进行什么样的操作。可以通过on_delete
来指定。可以指定的类型如下:
CASCADE:级联操作。如果外键对应的那条数据被删除了,那么这条数据也会被删除。
PROTECT:受保护。即只要这条数据引用了外键的那条数据,那么就不能删除外键的那条数据。
- SET_NULL:设置为空。如果外键的那条数据被删除了,那么在本条数据上就将这个字段设置为空。如果设置这个选项,前提是要指定这个字段可以为空。
- SET_DEFAULT:设置默认值。如果外键的那条数据被删除了,那么本条数据上就将这个字段设置为默认值。如果设置这个选项,前提是要指定这个字段一个默认值。
- SET():如果外键的那条数据被删除了。那么将会获取
SET
函数中的值来作为这个外键的值。SET
函数可以接收一个可以调用的对象(比如函数或者方法),如果是可以调用的对象,那么会将这个对象调用后的结果作为值返回回去。 - DO_NOTHING:不采取任何行为。一切全看数据库级别的约束。
以上这些选项只是Django级别的,数据级别依旧是RESTRICT!
5-3 表关系
1)一对多
1、应用场景:比如文章和作者之间的关系。一个文章只能由一个作者编写,但是一个作者可以写多篇文章。文章和作者之间的关系就是典型的多对一的关系。
2、实现方式:一对多或者多对一,都是通过ForeignKey
来实现的。还是以文章和作者的案例进行讲解。
class User(models.Model): username = models.CharField(max_length=20) password = models.CharField(max_length=100) class Article(models.Model): title = models.CharField(max_length=100) content = models.TextField() author = models.ForeignKey("User",on_delete=models.CASCADE)
那么以后在给Article
对象指定author
,就可以使用以下代码来完成:
article = Article(title='abc',content='123') author = User(username='zhiliao',password='111111') # 要先保存到数据库中 author.save() article.author = author article.save()
并且以后如果想要获取某个用户下所有的文章,可以通过article_set
来实现。示例代码如下:
user = User.objects.first() # 获取第一个用户写的所有文章 articles = user.article_set.all() for article in articles: print(article)
如果想要将文章添加到某个分类中。可以使用一下的方式:
category = Category.objects.first() article = Article(title='bbb',content='vvv') article.author = FrontUser.objects.first() category.article_set.add(article,bulk=False)
* 使用`bulk=False`,那么Django会自动的保存article,而不需要在添加到category之前先保存article。
* 或者是另外一种解决方式是,在添加到`category.article_set`中之前,先将`article`保存到数据库中。但是如果`article.category`不能为空,那么就产生一种死循环了,article没有`category`不能保存,而将article添加到`cateogry.artile_set`中,又需要article之前是已经存储到数据库中的。
* 如果是上面的那种需求,建议使用`bulk=False`的解决方案。
2) 一对一
1、在Django中一对一是通过`models.OnetToOneField`来实现的。这个`OneToOneField`其实本质上就是一个外键,只不过这个外键有一个`唯一约束(unique key)`,来实现一对一。
2、要反向引用,那么是通过引用的模型的名字转换为小写的形式进行访问。比如以下模型:
class FrontUser(models.Model): username = models.CharField(max_length=200) class UserExtension(models.Model): school = models.CharField(max_length=100) user = models.OneToOneField("FrontUser",on_delete=models.CASCADE) # 通过userextension来访问UserExtension对象 user = FrontUser.objects.first() print(user.userextension)
`UserExtension`的对象,可以通过`user`来访问到对应的user对象。并且`FrontUser`对象可以使用`userextension`来访问对应的`UserExtension`对象。如果不想使用Django默认的引用属性名字。那么可以在`OneToOneField`中添加一个`related_name`参数。示例代码如下:
class FrontUser(models.Model): username = models.CharField(max_length=200) class UserExtension(models.Model): school = models.CharField(max_length=100) user = models.OneToOneField("FrontUser",on_delete=models.CASCADE,related_name='extension') # 通过userextension来访问UserExtension对象 user = FrontUser.objects.first() print(user.extension)
那么以后`FrontUser`的对象就可以通过`extension`属性来访问到对应的`UserExtension`对象。
3) 多对多
1、应用场景:比如文章和标签的关系。一篇文章可以有多个标签,一个标签可以被多个文章所引用。因此标签和文章的关系是典型的多对多的关系。
2、实现方式:`Django`为这种多对多的实现提供了专门的`Field`。叫做`ManyToManyField`。还是拿文章和标签为例进行讲解。示例代码如下:
class Article(models.Model): title = models.CharField(max_length=100) content = models.TextField() tags = models.ManyToManyField("Tag",related_name="articles") class Tag(models.Model): name = models.CharField(max_length=50)
在数据库层面,实际上`Django`是为这种多对多的关系建立了一个中间表。这个中间表分别定义了两个外键,引用到`article`和`tag`两张表的主键。
六 查询操作
6-1 查询条件
1) exact
使用精确的=
进行查找。如果提供的是一个None
,那么在SQL
层面就是被解释为NULL
。示例代码如下:
article = Article.objects.get(id__exact=14) article = Article.objects.get(id__exact=None)
以上的两个查找在翻译为SQL
语句为如下:
select ... from article where id=14; select ... from article where id IS NULL;
2)iexact
使用like
进行查找。示例代码如下:
article = Article.objects.filter(title__iexact='hello world')
那么以上的查询就等价于以下的SQL
语句:
select ... from article where title like 'hello world';
注意:上面这个sql
语句,因为在MySQL
中,没有一个叫做ilike
的。所以exact
和iexact
的区别实际上就是LIKE
和=
的区别,在大部分collation=utf8_general_ci
情况下都是一样的(collation
是用来对字符串比较的)。
3)QuerySet.query
QuerySet.query:`query`可以用来查看这个`ORM`查询语句最终被翻译成的`SQL`语句。但是`query`只能被用在`QuerySet`对象上,不能用在普通的`ORM模型`上。因此如果你的查询语句是通过`get`来获取数据的,那么就不能使用`query`,因为`get`返回的是满足条件的`ORM`模型,而不是`QuerySet`。如果你是通过`filter`等其他返回`QuerySet`的方法查询的,那么就可以使用`query`。
4)contains
使用大小写敏感的判断,某个字符串是否在指定的字段中。这个判断条件会使用大小敏感,因此在被翻译成`SQL`语句的时候,会使用`like binary`,而`like binary`就是使用大小写敏感的。
5)icontains
使用大小写不敏感的判断,某个字符串是否被包含在指定的字段中。这个查询语句在被翻译成`SQL`的时候,使用的是`like`,而`like`在`MySQL`层面就是不区分大小写的。
contains和icontains:在被翻译成`SQL`的时候使用的是`%hello%`,就是只要整个字符串中出现了`hello`都能过够被找到,而`iexact`没有百分号,那么意味着只有完全相等的时候才会被匹配到。
6)in
可以直接指定某个字段的是否在某个集合中。示例代码如下:
articles = Article.objects.filter(id__in=[1,2,3])
也可以通过其他的表的字段来判断是否在某个集合中。示例代码如下:
categories = Category.objects.filter(article__id__in=[1,2,3])
如果要判断相关联的表的字段,那么也是通过`__`来连接。并且在做关联查询的时候,不需要写`models_set`,直接使用`模型的名字的小写化`就可以了。比如通过分类去查找相应的文章,那么通过`article__id__in`就可以了,而不是写成`article_set__id__in`的形式。当然如果你不想使用默认的形式,可以在外键定义的时候传递`related_query_name`来指定反向查询的名字。示例代码如下:
class Category(models.Model): name = models.CharField(max_length=100) class Meta: db_table = 'category' class Article(models.Model): title = models.CharField(max_length=200) content = models.TextField() cateogry =models.ForeignKey("Category",on_delete=models.CASCADE,null=True,related_query_name='articles') class Meta: db_table = 'article'
因为在`cateogry`的`ForeignKey`中指定了`related_query_name`为`articles`,因此你不能再使用`article`来进行反向查询了。这时候就需要通过`articles__id__in`来进行反向查询。
反向查询是将模型名字小写化。比如`article__in`。可以通过`related_query_name`来指定自己的方式,而不使用默认的方式。
反向引用是将模型名字小写化,然后再加上`_set`,比如`article_set`,可以通过`related_name`来指定自己的方式,而不是用默认的方式。
并且,如果在做反向查询的时候,如果查询的字段就是模型的主键,那么可以省略掉这个字段,直接写成`article__in`就可以了,不需要这个`id`了。
`in`不仅仅可以指定列表/元组,还可以为`QuerySet`。比如要查询“文章标题中包含有hello的所有分类”,那么可以通过以下代码来实现:
articles = Article.objects.filter(title__icontains='hello') categories = Category.objects.filter(articles__in=articles) for cateogry in categories: print(cateogry)
7)gt、gte、lt、lte
代表的是大于、大于等于、小于、小于等于的条件。示例代码如下:
articles = Article.objects.filter(id__lte=3)
8)startswith、istartswith、endswith、iendswith
表示以某个值开始,不区分大小写的以某个值开始、以某个值结束、不区分大小写的以某个值结束。示例代码如下:
articles = Article.objects.filter(title__endswith="hello")
9)时间的查询条件
range:可以指定一个时间段。并且时间应该标记为`aware`时间,不然django会报警告。示例代码如下:
start_time = make_aware(datetime(year=2018,month=4,day=4,hour=17,minute=0,second=0)) end_time = make_aware(datetime(year=2018,month=4,day=4,hour=18,minute=0,second=0)) articles = Article.objects.filter(create_time__range=(start_time,end_time)) print(articles.query) print(articles)
date:用年月日来进行过滤。如果想要使用这个过滤条件,那么前提必须要在`MySQL`中添加好那些时区文件。如何添加呢?参考教案。示例代码如下:
articles = Article.objects.filter(create_time__date=datetime(year=2018,month=4,day=4))
year/month/day:表示根据年/月/日进行查找。示例代码如下:
articles = Article.objects.filter(create_time__year__gte=2018)
week_day:根据星期来进行查找。1表示星期天,7表示星期六,2-6代表的是星期一到星期五。比如要查找星期三的所有文章,那么可以通过以下代码来实现:
# 查找星期三的全部文章 articles = Article.objects.filter(create_time__week_day=4)
time:根据分时秒来进行查找。如果要具体到秒,一般比较难匹配到,可以使用区间的方式来进行查找。区间使用`range`条件。比如想要获取17时/10分/27-28秒之间的文章,那么可以通过以下代码来实现:
start_time = time(hour=17,minute=10,second=27) end_time = time(hour=17,minute=10,second=28) articles = Article.objects.filter(create_time__time__range=(start_time,end_time))
更多的关于时间的过滤,请参考Django
官方文档:https://docs.djangoproject.com/en/2.0/ref/models/querysets/#range
10)isnull
根据值是否为空进行查找。示例代码如下:
articles = Article.objects.filter(pub_date__isnull=False)
以上的代码的意思是获取所有发布日期不为空的文章。将来翻译成SQL
语句如下:
select ... where pub_date is not null;
11)regex和iregex
大小写敏感和大小写不敏感的正则表达式。示例代码如下:
articles = Article.objects.filter(title__regex=r'^hello')
以上代码的意思是提取所有标题以hello
字符串开头的文章。将翻译成以下的SQL
语句:
select ... where title regexp binary '^hello';
iregex
是大小写不敏感的。
12)根据关联的表进行查询
假如现在有两个ORM
模型,一个是Article
,一个是Category
。代码如下:
class Category(models.Model): """文章分类表""" name = models.CharField(max_length=100) class Article(models.Model): """文章表""" title = models.CharField(max_length=100,null=True) category = models.ForeignKey("Category",on_delete=models.CASCADE)
比如想要获取文章标题中包含"hello"的所有的分类。那么可以通过以下代码来实现:
categories = Category.object.filter(article__title__contains("hello"))
6-2 聚合函数
如果你用原生SQL
,则可以使用聚合函数来提取数据。比如提取某个商品销售的数量,那么可以使用Count
,如果想要知道商品销售的平均价格,那么可以使用Avg
。
聚合函数是通过aggregate
方法来实现的。在讲解这些聚合函数的用法的时候,都是基于以下的模型对象来实现的。
class Author(models.Model): """作者模型""" name = models.CharField(max_length=100) age = models.IntegerField() email = models.EmailField() class Meta: db_table = 'author' class Publisher(models.Model): """出版社模型""" name = models.CharField(max_length=300) class Meta: db_table = 'publisher' class Book(models.Model): """图书模型""" name = models.CharField(max_length=300) pages = models.IntegerField() price = models.FloatField() rating = models.FloatField() author = models.ForeignKey(Author,on_delete=models.CASCADE) publisher = models.ForeignKey(Publisher, on_delete=models.CASCADE) class Meta: db_table = 'book' class BookOrder(models.Model): """图书订单模型""" book = models.ForeignKey("Book",on_delete=models.CASCADE) price = models.FloatField() create_time = models.DateTimeField(auto_now_add=True,null=True) class Meta: db_table = 'book_order'
1)Avg
求平均值。比如想要获取所有图书的价格平均值。那么可以使用以下代码实现。
from django.db.models import Avg result = Book.objects.aggregate(Avg('price')) print(result)
以上的打印结果是:
{"price__avg":23.0}
其中price__avg
的结构是根据field__avg
规则构成的。如果想要修改默认的名字,那么可以将Avg
赋值给一个关键字参数。示例代码如下:
from django.db.models import Avg result = Book.objects.aggregate(my_avg=Avg('price')) print(result)
那么以上的结果打印为:
{"my_avg":23}
2)aggregate和annotate区别
相同:这两个方法都可以执行聚合函数。
不同
-
- aggregate返回的是一个字典,在这个字典中存储的是这个聚合函数执行的结果。而`annotate`返回的是一个`QuerySet`对象,并且会在查找的模型上添加一个聚合函数的属性。
- aggregate不会做分组,而`annotate`会使用`group by`子句进行分组,只有调用了`group by`子句,才能对每一条数据求聚合函数的值。
3)Count
获取指定的对象的个数。示例代码如下:
from django.db.models import Count result = Book.objects.aggregate(book_num=Count('id'))
以上的result
将返回Book
表中总共有多少本图书。
Count
类中,还有另外一个参数叫做distinct
,默认是等于False
,如果是等于True
,那么将去掉那些重复的值。比如要获取作者表中所有的不重复的邮箱总共有多少个,那么可以通过以下代码来实现:
from djang.db.models import Count result = Author.objects.aggregate(count=Count('email',distinct=True))
4)Max和Min
获取指定对象的最大值和最小值。比如想要获取Author
表中,最大的年龄和最小的年龄分别是多少。那么可以通过以下代码来实现:
from django.db.models import Max,Min result = Author.objects.aggregate(Max('age'),Min('age'))
如果最大的年龄是88,最小的年龄是18。那么以上的result将为:
{"age__max":88,"age__min":18}
5)Sum
求指定对象的总和。比如要求图书的销售总额。那么可以使用以下代码实现:
from djang.db.models import Sum result = Book.objects.annotate(total=Sum("bookstore__price")).values("name","total")
以上的代码annotate
的意思是给Book
表在查询的时候添加一个字段叫做total
,这个字段的数据来源是从BookStore
模型的price
的总和而来。values
方法是只提取name
和total
两个字段的值。
`aggregate`和`annotate`方法可以在任何的`QuerySet`对象上调用。因此只要是返回了`QuerySet`对象,那么就可以进行链式调用。比如要获取2018年度的销售总额,那么可以先过滤年份,再求聚合函数。示例代码如下:
BookOrder.objects.filter(create_time__year=2018).aggregate(total=Sum('price'))
更多的聚合函数请参考官方文档:https://docs.djangoproject.com/en/2.0/ref/models/querysets/#aggregation-functions
6-3 F表达式和Q表达式
1)F表达式
F表达式
是用来优化ORM
操作数据库的。比如我们要将公司所有员工的薪水都增加1000元,如果按照正常的流程,应该是先从数据库中提取所有的员工工资到Python内存中,然后使用Python代码在员工工资的基础之上增加1000元,最后再保存到数据库中。这里面涉及的流程就是,首先从数据库中提取数据到Python内存中,然后在Python内存中做完运算,之后再保存到数据库中。示例代码如下:
employees = Employee.objects.all() for employee in employees: employee.salary += 1000 employee.save()
而我们的F表达式
就可以优化这个流程,他可以不需要先把数据从数据库中提取出来,计算完成后再保存回去,他可以直接执行SQL语句
,就将员工的工资增加1000元。示例代码如下:
from djang.db.models import F Employee.object.update(salary=F("salary")+1000)
F表达式
并不会马上从数据库中获取数据,而是在生成SQL
语句的时候,动态的获取传给F表达式
的值。
比如如果想要获取作者中,name
和email
相同的作者数据。如果不使用F表达式
,那么需要使用以下代码来完成:
authors = Author.objects.all() for author in authors: if author.name == author.email: print(author)
如果使用F表达式
,那么一行代码就可以搞定。示例代码如下:
from django.db.models import F authors = Author.objects.filter(name=F("email"))
2)Q表达式
使用`Q`表达式包裹查询条件,可以在条件之间进行多种操作。与/或非等,从而实现一些复杂的查询操作。例子如下:
查找价格大于100,并且评分达到4.85以上的图书
# 不使用Q表达式的 books = Book.objects.filter(price__gte=100,rating__gte=4.85) # 使用Q表达式的 books = Book.objects.filter(Q(price__gte=100)&Q(rating__gte=4.85))
查找价格低于100元,或者评分低于4分的图书
books = Book.objects.filter(Q(price__gte=100)&Q(rating__gte=4.85))
获取价格大于100,并且图书名字中不包含”传“字的图书
books = Book.objects.filter(Q(price__gte=100)&~Q(name__icontains='传'))
七 Query Set API
我们通常做查询操作的时候,都是通过模型名字.objects
的方式进行操作。其实模型名字.objects
是一个django.db.models.manager.Manager
对象,而Manager
这个类是一个“空壳”的类,他本身是没有任何的属性和方法的。他的方法全部都是通过Python
动态添加的方式,从QuerySet
类中拷贝过来的。示例图如下:
这个对象是`django.db.models.manager.Manager`的对象,这个类是一个空壳类,他上面的所有方法都是从`QuerySet`这个类上面拷贝过来的。因此我们只要学会了`QuerySet`,这个`objects`也就知道该如何使用了。
Manager源码解析
class_name = "BaseManagerFromQuerySet" class_dict = { '_queryset_class': QuerySet } class_dict.update(cls._get_queryset_methods(QuerySet)) # type动态的时候创建类 # 第一个参数是用来指定创建的类的名字。创建的类名是:BaseManagerFromQuerySet # 第二个参数是用来指定这个类的父类。 # 第三个参数是用来指定这个类的一些属性和方法 return type(class_name,(cls,),class_dict) _get_queryset_methods:这个方法就是将QuerySet中的一些方法拷贝出来
7-1 QuerySet 对象方法
1)filter:将满足条件的数据提取出来,返回一个新的QuerySet
。具体的filter
可以提供什么条件查询。请见查询操作章节。
2)exclude:排除满足条件的数据,返回一个新的QuerySet
。示例代码如下:
Article.objects.exclude(title__contains='hello')
以上代码的意思是提取那些标题不包含hello
的图书。
3)annotate:给QuerySet
中的每个对象都添加一个使用查询表达式(聚合函数、F表达式、Q表达式、Func表达式等)的新字段。示例代码如下:
articles = Article.objects.annotate(author_name=F("author__name"))
以上代码将在每个对象中都添加一个author__name
的字段,用来显示这个文章的作者的年龄。
4)order_by:指定将查询的结果根据某个字段进行排序。如果要倒叙排序,那么可以在这个字段的前面加一个负号。示例代码如下:
# 根据创建的时间正序排序 articles = Article.objects.order_by("create_time") # 根据创建的时间倒序排序 articles = Article.objects.order_by("-create_time") # 根据作者的名字进行排序 articles = Article.objects.order_by("author__name") # 首先根据创建的时间进行排序,如果时间相同,则根据作者的名字进行排序 articles = Article.objects.order_by("create_time",'author__name')
一定要注意的一点是,多个order_by
,会把前面排序的规则给打乱,而使用后面的排序方式。比如以下代码
articles = Article.objects.order_by("create_time").order_by("author__name")
他会根据作者的名字进行排序,而不是使用文章的创建时间。
5)values:用来指定在提取数据出来,需要提取哪些字段。默认情况下会把表中所有的字段全部都提取出来,可以使用values
来进行指定,并且使用了values
方法后,提取出的QuerySet
中的数据类型不是模型,而是在values
方法中指定的字段和值形成的字典
articles = Article.objects.values("title",'content') for article in articles: print(article)
以上打印出来的article
是类似于{"title":"abc","content":"xxx"}
的形式。
如果在values
中没有传递任何参数,那么将会返回这个恶模型中所有的属性。
6)values_list:类似于values
。只不过返回的QuerySet
中,存储的不是字典,而是元组。示例代码如下:
articles = Article.objects.values_list("id","title") print(articles)
那么在打印articles
后,结果为<QuerySet [(1,'abc'),(2,'xxx'),...]>
等。
如果在values_list
中只有一个字段。那么你可以传递flat=True
来将结果扁平化。示例代码如下
articles = Article.objects.values_list("title") print(articles) >> <QuerySet [("abc",),("xxx",),...]> articles2 = Article.objects.values_list("title",flat=True) >> <QuerySet ["abc",'xxx',...]>
7)all
:获取这个ORM
模型的QuerySet
对象。
8)select_related:在提取某个模型的数据的同时,也提前将相关联的数据提取出来。比如提取文章数据,可以使用select_related
将author
信息提取出来,以后再次使用article.author
的时候就不需要再次去访问数据库了。可以减少数据库查询的次数。示例代码如下:
article = Article.objects.get(pk=1) >> article.author # 重新执行一次查询语句 article = Article.objects.select_related("author").get(pk=2) >> article.author # 不需要重新执行查询语句了
注意:select_related
只能用在一对多
或者一对一
中,不能用在多对多
或者多对一
中。比如可以提前获取文章的作者,但是不能通过作者获取这个作者的文章,或者是通过某篇文章获取这个文章所有的标签。
9)prefetch_related
和select_related
非常的类似,就是在访问多个表中的数据的时候,减少查询的次数。这个方法是为了解决多对一
和多对多
的关系的查询问题。比如要获取标题中带有hello
字符串的文章以及他的所有标签,示例代码如下
from django.db import connection articles = Article.objects.prefetch_related("tag_set").filter(title__contains='hello') print(articles.query) # 通过这条命令查看在底层的SQL语句 for article in articles: print("title:",article.title) print(article.tag_set.all()) # 通过以下代码可以看出以上代码执行的sql语句 for sql in connection.queries: print(sql)
但是如果在使用article.tag_set
的时候,如果又创建了一个新的QuerySet
那么会把之前的SQL
优化给破坏掉。比如以下代码
tags = Tag.obejcts.prefetch_related("articles") for tag in tags: articles = tag.articles.filter(title__contains='hello') #因为filter方法会重新生成一个QuerySet,因此会破坏掉之前的sql优化 # 通过以下代码,我们可以看到在使用了filter的,他的sql查询会更多,而没有使用filter的,只有两次sql查询 for sql in connection.queries: print(sql)
那如果确实是想要在查询的时候指定过滤条件该如何做呢,这时候我们可以使用django.db.models.Prefetch
来实现,Prefetch
这个可以提前定义好queryset
。示例代码如下
tags = Tag.objects.prefetch_related(Prefetch("articles",queryset=Article.objects.filter(title__contains='hello'))).all() for tag in tags: articles = tag.articles.all() for article in articles: print(article) for sql in connection.queries: print('='*30) print(sql)
因为使用了Prefetch
,即使在查询文章的时候使用了filter
,也只会发生两次查询操作。
10)defer和only
这两个方法都会返回一个 Query Set 对象,并且这个 Query Set 中装的都是模型,而不是字典。
1、defer :这个方法是用来告诉 ORM ,在查询某个模型的时候,过滤掉某些字段。
注意:使用 defer 方法,以后再使用这个方法,会重新发起一次请求。
2、only :这个方法是用来告诉 ORM , 在查询某个模型的时候,只提取某几个字段。
注意:使用没有加在 only 方法中的字段,会向数据库重新发起一次请求
11)get方法
获取满足条件的数据。这个函数只能返回一条数据,并且如果给的条件有多条数据,那么这个方法会抛出MultipleObjectsReturned
错误,如果给的条件没有任何数据,那么就会抛出DoesNotExit
错误。所以这个方法在获取数据的只能,只能有且只有一条。
12)create 方法
创建一条数据,并且保存到数据库中。这个方法相当于先用指定的模型创建一个对象,然后再调用这个对象的save
方法。示例代码如下
article = Article(title='abc') article.save() # 下面这行代码相当于以上两行代码 article = Article.objects.create(title='abc')
13)get_or_create
根据某个条件进行查找,如果找到了那么就返回这条数据,如果没有查找到,那么就创建一个。示例代码如下
created= Category.objects.get_or_create(title='默认分类')
如果有标题等于默认分类
的分类,那么就会查找出来,如果没有,则会创建并且存储到数据库中。
这个方法的返回值是一个元组,元组的第一个参数obj
是这个对象,第二个参数created
代表是否创建的。
14)bulk_create
一次性创建多个数据。示例代码如下
Tag.objects.bulk_create([ Tag(name='111'), Tag(name='222'), ])
15)count方法
获取提取的数据的个数。如果想要知道总共有多少条数据,那么建议使用count
,而不是使用len(articles)
这种。因为count
在底层是使用select count(*)
来实现的,这种方式比使用len
函数更加的高效。
16)first方法和last方法
返回QuerySet
中的第一条和最后一条数据。
17)aggregate
使用聚合函数
18)exists
判断某个条件的数据是否存在。如果要判断某个条件的元素是否存在,那么建议使用exists
,这比使用count
或者直接判断QuerySet
更有效得多。示例代码如下
if Article.objects.filter(title__contains='hello').exists(): print(True) 比使用count更高效: if Article.objects.filter(title__contains='hello').count() > 0: print(True) 也比直接判断QuerySet更高效: if Article.objects.filter(title__contains='hello'): print(True)
19)distinct
去除掉那些重复的数据。这个方法如果底层数据库用的是MySQL
,那么不能传递任何的参数。比如想要提取所有销售的价格超过80元的图书,并且删掉那些重复的,那么可以使用distinct
来帮我们实现,示例代码如下
books = Book.objects.filter(bookorder__price__gte=80).distinct()
需要注意的是,如果在distinct
之前使用了order_by
,那么因为order_by
会提取order_by
中指定的字段,因此再使用distinct
就会根据多个字段来进行唯一化,所以就不会把那些重复的数据删掉。示例代码如下
orders = BookOrder.objects.order_by("create_time").values("book_id").distinct()
那么以上代码因为使用了order_by
,即使使用了distinct
,也会把重复的book_id
提取出来。
20)update
执行更新操作,在SQL
底层走的也是update
命令。比如要将所有category
为空的article
的article
字段都更新为默认的分类。示例代码如下
Article.objects.filter(category__isnull=True).update(category_id=3)
注意这个方法走的是更新的逻辑。所以更新完成后保存到数据库中不会执行save
方法,因此不会更新auto_now
设置的字段
21)delete
删除所有满足条件的数据。删除数据的时候,要注意on_delete
指定的处理方式。
22)切片操作
有时候我们查找数据,有可能只需要其中的一部分。那么这时候可以使用切片操作来帮我们完成。QuerySet
使用切片操作就跟列表使用切片操作是一样的。示例代码如下
books = Book.objects.all()[1:3] for book in books: print(book)
切片操作并不是把所有数据从数据库中提取出来再做切片操作。而是在数据库层面使用LIMIE
和OFFSET
来帮我们完成。所以如果只需要取其中一部分的数据的时候,建议大家使用切片操作。
23)什么时候Django
会将QuerySet
转换为SQL
去执行
生成一个QuerySet
对象并不会马上转换为SQL
语句去执行。
比如我们获取Book
表下所有的图书
books = Book.objects.all() print(connection.queries)
我们可以看到在打印connection.quries
的时候打印的是一个空的列表。说明上面的QuerySet
并没有真正的执行。在以下情况下QuerySet
会被转换为SQL
语句执行
1、迭代:在遍历QuerySet
对象的时候,会首先先执行这个SQL
语句,然后再把这个结果返回进行迭代。比如以下代码就会转换为SQL
语句
for book in Book.objects.all(): print(book)
2、使用步长做切片操作:QuerySet
可以类似于列表一样做切片操作。做切片操作本身不会执行SQL
语句,但是如果如果在做切片操作的时候提供了步长,那么就会立马执行SQL
语句。需要注意的是,做切片后不能再执行filter
方法,否则会报错
3、调用len
函数:调用len
函数用来获取QuerySet
中总共有多少条数据也会执行SQL
语句。
4、调用list
函数:调用list
函数用来将一个QuerySet
对象转换为list
对象也会立马执行SQL
语句。
5、if判断:如果对某个QuerySet
进行判断,也会立马执行SQL
语句。
八 ORM练习
8-1 准备工作
from django.db import models class Student(models.Model): name = models.CharField(max_length=100) gender = models.SmallIntegerField() class Meta: db_table = 'student' class Course(models.Model): name = models.CharField(max_length=100) teacher = models.ForeignKey("Teacher",on_delete=models.SET_NULL,null=True) class Meta: db_table = 'course' class Score(models.Model): student = models.ForeignKey("Student",on_delete=models.CASCADE) course = models.ForeignKey("Course",on_delete=models.CASCADE) number = models.FloatField() class Meta: db_table = 'score' class Teacher(models.Model): name = models.CharField(max_length=100) class Meta: db_table = 'teacher'
8-2 题目
1. 查询平均成绩大于60分的同学的id和平均成绩;
rows = Student.objects.annotate(avg=Avg("score__number")).filter(avg__gte=60).values("id","avg") for row in rows: print(row)
2. 查询所有同学的id、姓名、选课的数量、总成绩;
rows = Student.objects.annotate(course_nums=Count("score__course"),total_score=Sum("score__number")).values("id","name","course_nums","total_score") for row in rows: print(row)
3. 查询姓“李”的老师的个数;
teacher_nums = Teacher.objects.filter(name__startswith="李").count() print(teacher_nums)
4. 查询没学过“李老师”课的同学的id、姓名;
rows = Student.objects.exclude(score__course__teacher__name="黄老师").values('id','name') for row in rows: print(row)
5. 查询学过课程id为1和2的所有同学的id、姓名;
rows = Student.objects.filter(score__course__in=[1,2]).distinct().values('id','name') for row in rows: print(row)
6. 查询学过“黄老师”所教的“所有课”的同学的id、姓名;
rows = Student.objects.annotate(nums=Count("score__course",filter=Q(score__course__teacher__name='黄老师'))).filter(nums=Course.objects.filter(teacher__name='黄老师').count()).values('id','name') for row in rows: print(row)
7. 查询所有课程成绩小于60分的同学的id和姓名;
students = Student.objects.exclude(score__number__gt=60) for student in students: print(student)
8. 查询没有学全所有课的同学的id、姓名;
students = Student.objects.annotate(num=Count(F("score__course"))).filter(num__lt=Course.objects.count()).values('id','name') for student in students: print(student)
9. 查询所有学生的姓名、平均分,并且按照平均分从高到低排序;
students = Student.objects.annotate(avg=Avg("score__number")).order_by("avg").values('name','avg') for student in students: print(student)
10. 查询各科成绩的最高和最低分,以如下形式显示:课程ID,课程名称,最高分,最低分;
courses = Course.objects.annotate(min=Min("score__number"),max=Max("score__number")).values("id",'name','min','max') for course in courses: print(course)
11. 查询每门课程的平均成绩,按照平均成绩进行排序;
courses = Course.objects.annotate(avg=Avg("score__number")).order_by('avg').values('id','name','avg') for course in courses: print(course)
12. 统计总共有多少女生,多少男生;
rows = Student.objects.aggregate(male_num=Count("gender",filter=Q(gender=1)),female_num=Count("gender",filter=Q(gender=2))) print(rows)
13. 将“黄老师”的每一门课程都在原来的基础之上加5分;
rows = Score.objects.filter(course__teacher__name='黄老师').update(number=F("number")+5) print(rows)
14. 查询两门以上不及格的同学的id、姓名、以及不及格课程数;
students = Student.objects.annotate(bad_count=Count("score__number",filter=Q(score__number__lt=60))).filter(bad_count__gte=2).values('id','name','bad_count') for student in students: print(student)
15. 查询每门课的选课人数;
courses = Course.objects.annotate(student_nums=Count("score__student")).values('id','name','student_nums') for course in courses: print(course)
九 ORM模型迁移
9-1 迁移命令
1、makemigrations:将模型生成迁移脚本。模型所在的app
,必须放在settings.py
中的INSTALLED_APPS
中。这个命令有以下几个常用选项:
- app_label:后面可以跟一个或者多个
app
,那么就只会针对这几个app生成迁移脚本。如果没有任何的app_label,那么会检查INSTALLED_APPS
中所有的app下的模型,针对每一个app都生成响应的迁移脚本。 - --name:给这个迁移脚本指定一个名字。
- --empty:生成一个空的迁移脚本。如果你想写自己的迁移脚本,可以使用这个命令来实现一个空的文件,然后自己再在文件中写迁移脚本。
2、migrate:将新生成的迁移脚本。映射到数据库中。创建新的表或者修改表的结构。以下一些常用的选项:
- app_label:将某个
app
下的迁移脚本映射到数据库中。如果没有指定,那么会将所有在INSTALLED_APPS
中的app
下的模型都映射到数据库中。 - app_label migrationname:某个
app
下指定名字的migration
文件映射到数据库中。 - --fake:可以将指定的迁移脚本名字添加到数据库中。但是并不会把迁移脚本转换为SQL语句,修改数据库中的表。
- --fake-initial:将第一次生成的迁移文件版本号记录在数据库中。但并不会真正的执行迁移脚本。
3、showmigrations:查看某个app下的迁移文件。如果后面没有app,那么将查看INSTALLED_APPS
中所有的迁移文件。
4、sqlmigrate:查看某个迁移文件在映射到数据库中的时候,转换的SQL
语句。
9-2 migrations中的迁移版本和数据库中的迁移版本对不上怎么办?
1. 找到哪里不一致,然后使用python manage.py --fake [版本名字]
,将这个版本标记为已经映射。
2. 删除指定app
下migrations
和数据库表django_migrations
中和这个app
相关的版本号,然后将模型中的字段和数据库中的字段保持一致,再使用命令python manage.py makemigrations
重新生成一个初始化的迁移脚本,之后再使用命令python manage.py
makemigrations --fake-initial
来将这个初始化的迁移脚本标记为已经映射。以后再修改就没有问题了。
更多关于迁移脚本的。请查看官方文档:
https://docs.djangoproject.com/en/2.0/topics/migrations/
9-3 根据已有的表自动生成模型
在实际开发中,有些时候可能数据库已经存在了。如果我们用Django
来开发一个网站,读取的是之前已经存在的数据库中的数据。那么该如何将模型与数据库中的表映射呢?根据旧的数据库生成对应的ORM
模型,需要以下几个步骤:
1. Django
给我们提供了一个inspectdb
的命令,可以非常方便的将已经存在的表,自动的生成模型。想要使用inspectdb
自动将表生成模型。首先需要在settings.py
中配置好数据库相关信息。不然就找不到数据库。示例代码如下:
DATABASES = { 'default': { 'ENGINE': 'django.db.backends.mysql', 'NAME': "migrations_demo", 'HOST': '127.0.0.1', 'PORT': '3306', 'USER': 'root', 'PASSWORD': 'root' } }
比如有以下表:
- article表
- tag表
- article_tag表
- front_user表
那么通过python manage.py inspectdb
,就会将表转换为模型后的代码,显示在终端:
from django.db import models class ArticleArticle(models.Model): title = models.CharField(max_length=100) content = models.TextField(blank=True, null=True) create_time = models.DateTimeField(blank=True, null=True) author = models.ForeignKey('FrontUserFrontuser', models.DO_NOTHING, blank=True, null=True)
以上代码只是显示在终端。如果想要保存到文件中。那么可以使用>
重定向输出到指定的文件。比如让他输出到models.py
文件中。示例命令如下:
python manage.py inspectdb > models.py
2. 修正模型:新生成的ORM
模型有些地方可能不太适合使用。比如模型的名字,表之间的关系等等。那么以下选项还需要重新配置一下:
- 模型名:自动生成的模型,是根据表的名字生成的,可能不是你想要的。这时候模型的名字你可以改成任何你想要的。
- 模型所属app:根据自己的需要,将相应的模型放在对应的app中。放在同一个app中也是没有任何问题的。只是不方便管理。
- 模型外键引用:将所有使用
ForeignKey
的地方,模型引用都改成字符串。这样不会产生模型顺序的问题。另外,如果引用的模型已经移动到其他的app中了,那么还要加上这个app的前缀。 - 让Django管理模型:将
Meta
下的managed=False
删掉,如果保留这个,那么以后这个模型有任何的修改,使用migrate
都不会映射到数据库中。 - 当有多对多的时候,应该也要修正模型。将中间表注视了,然后使用
ManyToManyField
来实现多对多。并且,使用ManyToManyField
生成的中间表的名字可能和数据库中那个中间表的名字不一致,这时候肯定就不能正常连接了。那么可以通过db_table
来指定中间表的名字。示例代码如下:
class Article(models.Model): title = models.CharField(max_length=100, blank=True, null=True) content = models.TextField(blank=True, null=True) author = models.ForeignKey('front.User', models.SET_NULL, blank=True, null=True) # 使用ManyToManyField模型到表,生成的中间表的规则是:article_tags # 但现在已经存在的表的名字叫做:article_tag # 可以使用db_table,指定中间表的名字 tags = models.ManyToManyField("Tag",db_table='article_tag') class Meta: db_table = 'article'
- 表名:切记不要修改表的名字。不然映射到数据库中,会发生找不到对应表的错误。
3. 执行命令python manage.py makemigrations
生成初始化的迁移脚本。方便后面通过ORM
来管理表。这时候还需要执行命令python manage.py migrate --fake-initial
,因为如果不使用--fake-initial
,那么会将迁移脚本会映射到数据库中。这时候迁移脚本会新创建表,而这个表之前是已经存在了的,所以肯定会报错。此时我们只要将这个0001-initial
的状态修改为已经映射,而不真正执行映射,下次再migrate
的时候,就会忽略他。
4. 将Django
的核心表映射到数据库中:Django
中还有一些核心的表也是需要创建的。不然有些功能是用不了的。比如auth
相关表。如果这个数据库之前就是使用Django
开发的,那么这些表就已经存在了。可以不用管了。如果之前这个数据库不是使用Django
开发的,那么应该使用migrate
命令将Django
中的核心模型映射到数据库中。
十 Pycharm 配置连接数据库
10-1 步骤
进入pycharm
后,右边有一个Database
的选项,点击这个选项会弹出以下界面:
然后点击绿色的添加按钮,会出现以下界面:
这时候我们选择MySQL
,然后会弹出以下配置MySQL
的对话框
填入相关的信息。然后Test Connection
测试成功后,点击确定即可!
10-2 关于没有Java Connector Driver
Pycharm
是用java
写的,连接MySQL
数据库需要一个driver
文件,从以下链接中下载mysql-connector-java-5.1.46.zip
: https://dev.mysql.com/downloads/connector/j/
,然后解压后,来到以下界面
然后点击右边的加号按钮,把刚刚下载的mysql-connector-java-5.1.46-bin.jar
加载进来。