django基础之Django模型
数据库操作
Django配置连接数据库
在Django中配置数据库连接是非常简单的。对于使用django-admin工具创建的项目, settings.py文件中已经有了DATABASES这个变量, 如果没有的话, 可以直接创建这个变量, 这个变量的类型是一个字典。示例代码如下:
# 这里是settings.py的内容 DATABASES = { 'default': { 'ENGINE': 'django.db.backends.mysql', # 配置引擎 'OPTIONS': { 'read_default_file': '/path/to/my.cnf', # 配置文件路径 }, 'USER': 'featherwit', # 数据库用户名 'PASSWORD': 'mysql', # 数据库密码 'HOST': '127.0.0.1', # 数据库服务监听IP 'POST': 3306, # 数据库服务监听端口 'NAME': 'dadta' # 数据库名 } } # 这里是/path/to/my.cnf文件的内容 [client] database = data user = featherwit password = mysql default-character-set = utf8 host = 127.0.0.1 port = 3306
连接配置有一定的顺序, 如果配置中定义了OPTIONS, 则OPTIONS中定义的连接信息会被优先使用; 如果没有定义OPTIONS, 则配置中的USER、NAME、PASSWORD、HOST、PORT将会被用到
DATABASES中定义的数据库的数量不受限制, 但必须定义一个名为default的数据库。数据库支持的配置如下:
- ENGINE: 这个配置定义数据库后端。Django自带后端支持PostgreSQL、MysQL、SQLite、Oracle
- HOST: 指定要联结的数据库主机地址。这是一个字符串, 若为空字符串, 则摩恩主机地址为localhost
- NAME: 数据库名
- CONN_MAX_AGE: 一个连接的生命周期, 单位为秒, 该字段设置为0, 代表在请求结束的时候断开连接
- OPTIONS: 默认是空字典, 用于配置连接到数据库的额外参数
- PASSWORD: 连接数据库的密码, 默认是空字符串
- PORT: 数据库的端口号, 是一个字符串
- USER: 连接数据库的用户名
在Django中操作数据库
在django
中操作数据库有两种方式。第一种方式是使用原生sql
语句操作, 第二种就是使用ORM
模型来操作。
在django
中使用原生sql
语句操作其实就是使用python db api
的接口操作。如果你的mysql
驱动是pymysql
, 那么你就是使用pymysql
来操作的, 只不过Django
将数据库连接的这一部分封装好了, 我们只需要在settings.py
文件中配置好了数据库连接信息后使用Django
封装好的接口就可以操作了。示例代码如下:
# 使用django封装好的connection对象, 会自动读取settings.py中的数据库的配置信息 from django.db import connection # 获取游标 cursor = connection.cursor() # 拿到游标后执行sql语句 cursor.execute('select * from book') # 获取所有数据 rows = cursor.fetchall() # 遍历查询到的数据 for row in rows: print(row)
以上的execute
以及fetchall
都是Python DB Api
规范中定义好的。任何使用Python
来操作MySQL
的驱动程序都应该遵循这个规范。所以不管是使用pymysql
或者是mysqlclient
, 他们的接口都是一样的。
Python DB Api规范下cursor对象常用接口
description
: 如果cursor
执行了查询的sql
语句。那么读取cursor.description
属性的时候, 将返回一个列表, 这个列表中装的是元组, 元组中装的分别是(name, type_code, display_size, internal_size, precision, scale, null_ok)
, 其中name
代表的是查找出来的数据的字段名称, 其他参数暂时用处不大rowcount
: 代表的是在执行了sql
语句后受影响的行数close
: 关闭游标。关闭游标以后就再也不能使用了, 否则会抛出异常-
execute(sql[, parameters])
: 执行某个sql
语句。如果在执行sql
语句的时候需要传递参数, 那么可以传给parameters
参数, 示例代码如下:
cursor.execute('select * from article where id=%s', (1, ))
- fetchone: 在执行了查询操作以后, 获取第一条数据
fetchmany(size)
: 在执行了查询操作以后, 获取多条数据, 具体是多少条要看传的size
参数。如果不传size
参数, 那么默认是获取第一条数据fetchall
: 获取所有满足sql
语句的数据
ORM模型
ORM模型介绍
随着项目的越来也大, 采用写原生SQL的方式在代码中会出现大量的SQL语句, 那么问题就出现了:
- SQL语句重复利用率不高, 越复杂的SQL语句条件越多, 代码越长。会出现很多相近的SQL语句
- 很多SQL语句是在业务逻辑中拼接出来的, 如果有数据库需要更改, 就要去修改这些逻辑, 这回很容易漏掉对某些SQL语句的修改
- 写SQL时容易忽略web安全问题, 给未来照成隐患
ORM
全称object Relational Mapping
, 中文叫做对象关系映射, 通过ORM
我们可以通过类的方式去操作数据库, 而不用写原生的SQL语句。通过把表映射成类, 把行作为实例, 把字段作为属性, ORM
在执行对象操作的时候最终还是会把对应的操作转换为数据库的原生语句。使用ORM
有许多优点:
- 易用性: 使用
ORM
做数据库的开发可以有效的减少重复SQL语句的概率, 写出来的模型也更加的直观、清晰 - 性能损耗小:
ORM
转换成底层数据库操作指令确实会一些开销。但从实际的情况来看, 这种性能损耗很少(不足5%), 只要不是对性能有严苛的要求, 综合考虑开发的效率、代码的阅读性, 带来的好处要远大于性能损耗, 而且项目越大作业越明显 - 设计灵活: 可以轻松的写出复杂的查询
- 可移植性:
Django
封装了底层数据库的实现, 支持多个关系数据库引擎, 包括流行的MySQL
、PostgreSQL
和SQLlite
。可以非常轻松的切换数据库
创建ORM模型对象
ORM
模型一般都是放在app
的models.py
文件中。每个app
都可以拥有自己的模型。并且如果这个模型想要映射到数据库中, 那么这个app
必须放在settings.py
的INSTALLED_APP
中进行安装。以下是写一个简单的书籍ORM
模型。示例代码如下:
from django.db import models class Book(models.Model): name = models.CharField(max_length=32, null=False) author = models.CharField(max_length=32, null=False) pub_time = models.DateTimeField(default = datetime.now) price = models.FloatField(default=0)
以上便定义了一个模型。这个模型继承自django.db.models.Model
, 如果这个模型想要映射到数据库中, 就必须继承自这个类。这个模型以后映射到数据库中, 表名是模型的小写形式, 为book
。在这个表中, 有四个字段, 一个为name
, 这个字典是保存的是书的名称, 是varchar
类型, 最长不超过32个字符, 并且不能为空。第二个字段是作者名字, 同样也是varchar
类型, 长度不能超过32个。第三个是出版时间, 数据类型是datetime
类型, 默认是保存这本数据的时间。第五个是这本书的价格, 是浮点类型
模型映射到数据库中
将ORM
模型映射到数据库中, 总结起来就是以下几步:
- 在
settings.py
中, 配置好DATABASES
, 做好数据库相关的配置 - 在
app
中的models.py
中定义好模型, 这个模型必须继承自django.db.models
将这个
app
添加到settings.py
的INSTALLED_APP
中- 在命令行终端, 进入到项目所在的路径, 然后执行命令
python manage.py makemigrations
来生成迁移脚本文件 - 同样在命令行中, 执行命令
python manage.py migrate
来将迁移脚本文件映射到数据库中
ORM对数据库的基本操作
1. 添加数据
只要使用ORM模型创建一个对象。然后再调用这个ORM模型的save
方法就可以保存了, 示例代码如下:
book = Book(name='西游记', author='吴承恩', price=100) book.save()
2. 查找数据
所有的查找工作都是使用模型上的objects
属性来完成的, 当然也可以自定义查询对象
- 根据主键进行查找: 使用主键进行查找。可以使用
objects.get
方法。然后传递pk=xx
的方式进行查找。示例代码如下:
book = Book.objects.get(pk=2)
- 根据其他字段进行查找: 可以使用
objects.filter
方法进行查找。示例代码如下
books = Book.objects.filter(name='三国演义')
使用filter
方法返回来的是一个QuerySet
对象。这个对象类似于列表。我们可以使用这个对象的first
方法来获取第一个值
3. 删除数据
首先查找到对应的数据模型, 然后再执行这个模型的delete()
方法即可删除。示例代码如下:
book = Book.objects.get(pk=1)
book.delete()
4. 修改数据
首先查找到对应的数据模型, 然后修改这个模型上的属性的值。再执行save
方法即可修改完成。示例代码如下:
book = Book.objects.get(pk=2) book.price = 200 book.save()
模型常用字段
模型常用属性
在django
中, 定义了一些Field
与数据库表中的字段类型来进行映射。以下将介绍那些常用的字段类型
AutoField 映射到数据库中的是int类型, 可以有自动增长的特性。一般不需要使用这个类型, 如果不指定主键, 那么模型会自动的生成一个叫做id的自动增长的主键。如果你想指定一个其他名字的并且具有自动增长的主键, 使用AutoField也是可以的。 如果设置了AutoField, 那么必须将该字段的primary_key设置为True BigAutoField 64位的整形, 类似于AutoField, 只不过产生的数据的范围是1-9223372036854775807BooleanField 在模型层面上就说的是True/False。在数据库层面是tinyint类型。如果没有指定默认值, 默认值是None 在定义字段的时候, 如果没有指定null=True, 那么默认情况下null=False, 也就是不能为空 如果想要使用可以为null的BooleanField, 那么应该使用NullBooleanField来代替 CharField 在数据库层面是varchar类型, 在Python层面上就是普通的字符串。这个类型在使用的时候必须要指定最大的长度, 也即必须要传递max_length这个关键字参数进去 CharField如果超过了254个字符就不建议使用了, 推荐使用TextField来代替 DateField 日期类型。在Python中是datetime.date类型, 可以记录年月日。在映射到数据库中也是date类型。使用这个Field可传递以下几个参数: 1. auto_now: 在每次这个数据保存的时候, 都使用当前的时间, 比如作为一个记录修改日期的字段, 可以将这个属性设置为True 2. auto_now_add: 在每次数据第一次被添加进去的时候, 都使用当前的时间。比如作为第一个记录第一次入库的字段, 可以将这个属性设置为True TimeField 时间类型。在数据库中是time类型。在Python中是datetime.date类型 EmailField 类似于CharField。在数据库底层也是一个varchar类型。只不过这个Field可以在存储的时候检测这个字符串是否是一个有效的邮箱。最大长度是254个字符 EmailField在数据库层面并不会限制字符串一定要满足邮箱格式, 只是以后在使用ModelForm等表单相关操作的时候会起作用
FileField 用来存储文件的。 ImageField 用来存储图片文件的 FloatField 浮点类型, 映射到数据库中是float类型 IntegerField 整形 BigIntegerField 大整形 SmallIntegerField 小整形 PositiveSmallIntegerField 正小整形 TextField 大量的文本类型。映射到数据库中是longtext类型 UUIDFiled 只能存储uuid格式的字符串。uuid是一个32位的全球唯一的字符串, 一般用来作为主键 URLFiled 类似于CharField, 只不过只能用来存储url格式的字符串。并且默认的max_length是200
Field常用参数
null 如果设置为True,Django将会在映射表的时候指定是否为空。默认是为False。在使用字符串相关的Field(CharField/TextField)的时候,
官方推荐尽量不要使用这个参数, 也就是保存默认值False。因为Django在处理字符串相关的Field的时候, 即使这个Field的null=False, 如果你没有给这个Field传递任何值, 那么Django也会使用一个空的字符串""来作为默认值存储进去。
因此如果再使用null=True,Django会产生两种空值的情形(NULL或者空字符串)。如果想要在表单验证的时候允许这个字符串为空, 那么建议使用blank=True。如果你的Field是BooleanField, 那么对于的可空的字段则为NullBooleanField blank 表示这个字符在表单验证的时候是否可以为空。默认是False。这个和null是有区别的,null是一个纯数据库级别的。而blank是表单验证级别的 db_column 这个字段在数据库中的名字。如果设置了这个参数, 那么将会使用模型中属性的名字 default 默认值, 可以是一个值, 或者一个函数, 但是不支持lambda表达式, 并且不支持列表/字典/集合等可变的数据结构 primary_key 是否为主键。默认是False unique 在表中这个字段的值是否唯一。一般是设置手机号码/邮箱等
更多
Field
参数请参考官方文档: https://docs.djangoproject.com/zh-hans/2.0/ref/models/fields
模型中的Meta配置
对于一些模型级别的配置。我们可以在模型中定义一个类, 叫做Meta
。然后在这个类中添加一些类属性来控制模型的作用。比如我们想要在数据库映射的时候使用自己指定的表名, 而不是使用模型的名称。那么我们可以在Meta
类中添加一个db_table
的属性。示例代码如下:
class Book(models.Model): name = models.CharField(max_length=120, null=False) desc = models.CharField(max_length=100, name='description') class Meta: db_table = 'book_model'
以下将对Meta
类中的一些常用配置进行解释
db_table 这个模型映射到数据库的表名。如果没有指定这个参数, 那么在映射的时候将会使用模型名来作为默认的表名 ordering 设置在提取数据的排序方式, 比如想在查找数据的时候根据添加的时间排序, 那么示例代码如下: class Book(models.Model): name = models.CharField(max_length=120, null=False) desc = models.CharField(max_length=100, name='description') pub_date = models.DateField(auto_now_add=True) class Meta: db_table = 'book_model' ordering = ['pub_date']
外键和表关系
外键
在Mysql
中, 表有两种引擎, 一种是InnoDB
, 另一种是MYISAM
。如果使用的是InnoDB
引擎。是支持外键约束的。外键的存在, 使得ORM
框架在处理表关系的时候异常强大。因此我们首先来介绍下外键在Django
中的使用。
类定义为class ForeignKey(to, ondelete, **options)
。第一个参数是引用的是哪个模型, 第二个参数是在使用外键引用模型的数据被删除了, 这个字段如何处理, 比如有CASCADE
、SET_NULL
等。这里以一个实际的案例来说明。比如有一个user
和一个Article
两个模型。一个User
可以发表多篇文章, 一个Article
只能有一个Author
, 并且通过外键进行引用。那么相关的示例代码如下:
class User(models.Model): username = models.CharField(max_length=20) password = models.CharField(max_length=100) class Article(models.Model): title = models.CharField(max_length=100) content = models.TextField() author = models.ForeignKey('User', on_delete=models.CASCADE)
以上使用ForeignKey
来定义模型之间的关系。即在article
的实例中可以通过author
属性来操作对应的User
模型。这样使用起来非常的方便。示例代码如下:
article = Article(title='abc', content='123') author = User(username='张三', password='1111111') article.author = author article.save() # 修改article.author的值 article.author.username = '李四' article.save()
为什么使用了ForeignKey
后, 就能通过author
访问到对应的user
对象呢。因为在底层, Django
为Article
表添加了一个属性名_id
的字段(比如author的字段名称是author_id). 这个字段是一个外键, 记录着对应的作者的主键。以后通过article.author
访问的时候, 实际上是先通过author_id
找到对应的数据, 然后再提取User
表中的这条数据, 形成一个模型
# User模型在user这个app中 class User(models.Model): username = models.CharField(max_length=20) password = models.CharField(max_length=100) # Aritcle模型在aritcle这个app中 class Article(models.Model): title = models.CharField(max_length=100) content = models.TextField() author = models.ForeignKey('user.User', on_delete=models.CASCADE)
class Comment(models.Model): content = models.TextField() origin_comment = models.ForeignKey('self', on_delete=models.CASCADE, null=True) # 或者 # orgin_comment = models.ForeignKey('Comment', on_delete=models.CASCADE, null=True))
外键删除操作
如果一个模型使用了外键, 那么在对方那个模型被删除后, 该进行什么的操作。可以通过on_delete
来指定。可以指定的类型如下:
CASCADE
: 级联操作。如果外键对应的那条数据被删除了, 那么这条数据也会被删除PROTECT
: 受保护。即只要这条数据引用了外键的那条数据, 那么就不能删除外键的那条数据SET_NULL
: 设置为空。如果外键的那条数据被删除了, 那么在本条数据上就将这个字段设置为空, 如果设置这个选项, 前提是要指定这个字段可以为空SET_DEFAULT
: 设置为默认值。如果外键的那条数据被删除了, 那么本条数据上就将这个字段设置为默认值。如果设置这个选项, 前提是要指定这个字段的一个默认值SET()
: 如果外键的那条数据被删除了。那么将会获取set
函数中的值来作为这个外键的值,SET
函数可以接收一个调用的对象(比如函数或者方法), 如果是可以调用的对象, 那么会将这个对象调用后的结果作为值返回回去DO_NOTHING
: 不采取任何行为。一切全看数据库级别的约束
以上这些选项只是Django级别的, 数据级别依旧是RESTRICT!
related_name和related_query_name
还是以User
和Article
为例来进行说明。如果一个Article
想要访问对应的作者, 那么可以通过author
来进行访问。但是如果有一个user
对象, 想要通过这个user
对象获取所有的文章, 该如何做呢? 这时候就可以通过user.article_set
来访问, 这个名字的规律是模型名字小写_set
。示例代码如下:
user = User.objects.get(pk=1)
articles = user.article_set.all()
如果不想使用模型名字小写_set
的方式, 想要使用其他的名字, 那么可以在定义模型的时候指定related_name
。示例代码如下:
class Article(models.Model): title = models.CharField(max_length=100) content = models.TextField() author = models.ForeignKey('User', on_delete=models.CASCADE, related_name='articles')
user = User.objects.get(name='张三') user.articles.all()
如果不想使用反向引用的时候。那么可以指定related_name='+'
, 示例代码如下:
class Article(models.Model): title = models.CharField(max_length=100) content = models.TextField() author = models.ForeignKey('User', on_delete=models.CASCADE, related_name='+')
以后将不能通过user.articles
来访问文章模型了
users = User.objects.filter(article__title='abc')
如果你设置了related_name
为articles
, 因为反转的过滤器的名字将使用related_name
的名字, 那么上面的代码将改成如下:
users = User.objects.filter(articles__title='abc')
可以通过related_query_name
将查询的反转的名字修改成其他的名字。比如article
。示例代码如下:
class Article(models.Model): title = models.CharField(max_length=100) content = models.TextField() # 传递relate_name参数, 以后在反向引用的时候使用articles进行访问 author = models.ForeignKey('User', on_delete=models.CASCADE, related_name='articles', related_query_name='article')
那么在做反向过滤查找的时候就可以使用以下代码:
users = User.object.filter(article__title='abc')
表关系
表之间的关系都是通过外键来进行关联的。而表之间的关系, 无非就是三种关系: 一对一、一对多(多对一)、多对多等。以下将讨论以下三种关系的应用场景及其实现方式。
一对多
-
应用场景: 比如文章和作者之间的关系。一个文章只能由一个作者编写, 但是一个作者可以写多篇文章。文章和作者之间的关系就是典型的多对一的关系
-
实现方式: 一对多或者多对一, 都是通过
ForeignKey
来实现的。还是以文章和作者的案例进行讲解
class User(models.Model): username = models.CharField(max_length=20) password = models.CharField(max_length=100) class Article(models.Model): title = models.CharField(max_length=100) content = models.TextField() author = models.ForeignKey('User', on_delete=models.CASCADE)
article = Article(title='abc', content='123') author = User(username='feather', password='111111') # 要先保存到数据库中 author.save() article.author = author article.save()
并且以后如果想要获取某个用户下所有的文章, 可以通过article_set
来实现。示例代码如下:
user = User.object.first() # 获取第一个用户写的所有文章 articles = user.article_set.all() for aticle in articles: print(article)
一对一
-
应用场景: 比如一个用户表和一个用户信息表。在实际网站中, 可能需要保存用户的许多信息, 但是有些信息不经常用到。如果把所有用户信息都存放到一张表中可能会影响查询效率, 因此可以把用户的一些不常用的信息存放到另外一张表中, 我们叫做
UserExtension
。但是用户表User
和用户信息表UserExtension
就是典型的一对一了。 -
实现方式:
Django
为一对一提供了一个专门的Field
叫做OneToOneField
来实现一对一操作, 这个OneToOneField
其实本质上就是一个外键, 只不过这个外键有一个唯一约束(unique key)
。示例代码如下:
class User(models.Model): username = models.CharField(max_length=20) password = models.CharField(max_length=100) class UserExtension(models.Model): brithday = models.DateTimeField(null=True) school = models.CharField(blank=True, max_length=50) user = models.OneToOneField('User', on_delete=models.CASCADE)
在UserExtension
模型上增加了一对一的关系映射。其实底层是在UserExtension
这个表上增加了一个user_id
, 来和user
表进行关联, 并且这个数据在表中必须是唯一的, 来保证一对一。
以后如果想要反向引用, 那么是通过引用的模型的名字的小写的形式进行访问。示例代码如下:
# 通过userextension来访问UserExtension对象 user = FrontUser.objects.first() extension = user.userextension print(extension) # 如果不想使用Django默认的引用属性的名字, 那么可以在`OneToOneField`中添加一个`related_name`参数 # 通过extension来访问UserExtension对象 user = FrontUser.objects.first() extension = user.extension print(extension)
多对多
-
应用场景: 比如文章和标签的关系。一篇文章可以有多个标签, 一个标签可以被多个文章所引用。因此标签和文章的关系就是典型的多对多的关系
-
实现方式:
Django
为这种多对多的实现提供了专门的Field
。叫做ManyToManyField
。还是以文章和标签为例进行讲解。示例代码如下:
class Article(models.Model): title = models.CharField(max_length=100) content = models.TextField() tags = models.ManyToManyField('Tag', related_name='articles') class Tag(models.Model): name = models.CharField(max_leng=50)
在数据库层面上, 实际上Django
是为这种多对多的关键建立了一个中间表。这个中间表分别定义了两个外键, 引用到article
和tag
两张表的主键
增删改查操作
模型的操作
在ORM
框架中, 所有模型相关的操作, 比如添加/删除等。其实都是映射到数据库中一条数据的操作。因此在模型操作也就是数据库表中数据的操作
添加一个模型到数据库中
添加模型到数据库中。首先需要创建一个模型。创建模型的方式很简单, 就跟创建普通的Python
对象是一模一样的。在创建完模型之后, 需要调用模型的save
方法。这样Django
会自动的将这个模型转换成sql
语句, 然后存储到数据库中。示例代码如下:
class Book(models.Model): name = models.CharField(max_length=32, null=False) desc = models.CharField(max_length=100, name='description', db_column='description1') pub_date = models.DateTimeField(default = datetime.now) book = Book(name='三国演义', desc='三国英雄!') book.save()
查找数据
查找数据都是通过模型下的objects
对象来实现的
查找所有数据
要操作book
这个模型对应的表下的所有数据。那么示例代码如下:
books = Book.objects.all()
以上将返回Book
模型下的所有的数据
数据过滤
在查找数据的时候, 有时候需要对一些数据进行过滤。那么这个时候需要调用objects
的filter
方法。示例代码如下:
books = Book.objects.filter(name='三国演义') > [<Book:三国演义>] # 多个条件 books = Book.objects.filter(name='三国演义', desc='test')
调用filter
, 会将所有满足条件的模型对象都返回
获取单个对象
通过filter
返回的是所有满足条件的结果集。有时候如果只需要返回第一个满足条件的对象。那么可以使用get
方法。示例代码如下:
book = Book.objects.get(name='三国演义') > <Book:三国演义>
当然, 如果没有找到满足条件的对象, 那么就会抛出一个异常。而filter
在没有找到满足条件的数据的时候, 是返回一个空的列表
如果想在查找数据的时候使用某个字段来进行排序, 那么可以使用order_by
方法来实现。示例代码如下:
books = Book.objects.order_by('pub_date')
以上代码会在提取所有数据的时候, 将会使用pub_date
从小到大进行排序。如果想要进行倒序排序, 那么可以在pub_date
前面加一个负号。示例代码如下:
books = Book.objects.order_by('-pub_date')
修改数据
在查找到数据后, 便可以进行修改了。修改的方式非常简单, 只需要将查找出来的对象的某个属性进行修改, 然后再调用这个对象的save
方法便可以修改。示例代码如下:
from datetime import datetime book = Book.objects.get(name='三国演义') book.pub_date = datetime.now() book.save()
删除数据
在查找到数据后, 便可以进行删除了。删除数据非常简单, 只需要调用这个对象的delete
方法即可。示例代码如下:
book = Book.objects.get(name='三国演义') book.delete()
查询操作
查询是数据库操作中一个非常重要的技术。查询一般就是使用filter
、exclude
以及get
三个方法来实现。我们可以在调用这些方法的时候传递不同的参数来实现查询需求。在ORM
层面, 这些查询条件都是使用field
+__
+condition
的方式来使用的。以下将那些常用的查询条件来一一解释。
查询条件
- exact
精确的提供条件。如果提供的是一个None
, 那么在SQL
层面就是被解释为NULL
。示例代码如下:
article = Article.object.get(id__exact=14)
article = Article.object.get(id__exact=None)
以上的两个查询在翻译为SQL
语句 如下:
select * from article where id=14; select * from article where id is NULL;
- iexact
忽略大小写的精确查询。示例代码如下:
article = Article.object.get(title__iexact='hello world')
那么以上的查询就等价于以下的SQL
语句
select * from article where title ilike 'hello world'
注意: 上面这个
sql
语句, 使用的是ilike
, 这个在数据库层面代表的就是忽略大小写
- contains
大小写敏感, 判断某个字段是否包含了某个数据。示例代码如下:
articles = Article.objects.filter(title__contains='hello')
在翻译成SQL
语句如下:
select * from title where title like '%hello%'
注意: 在使用
contains
的时候, 翻译成sql
语句左右两边都是有百分号的, 意味着使用的是模糊查询。而exact
翻译成sql
语句左右两边是没有百分号的, 意味着使用的是精确查询
- icontains
大小写不敏感的匹配查询, 示例代码如下:
articles = Article.objects.filter(title__icontains='hello')
再翻译成SQL
语句如下:
select * from title where title ilike '%hello%'
- in
提取那些给定的field
的值是否存在给定的容器中。容器可以是list
、tuple
或者任何一个可以迭代的对象, 包括QuerySet
对象。示例代码如下:
articles = Article.object.filter(id__in=[1, 2, 3])
以上代码再翻译成SQL
语句为如下:
select * from article where id in (1, 2, 3)
当然也可以传递一个QuerySet
对象进去。示例代码如下:
inner_qs = Article.objects.filter(title__contains='hello') categories = Category.objects.filter(article__in=inner_qs)
以上代码的意思是获取那些文章标题包含hello
的所有分类
将翻译成以下的SQL
语句
select * from category where article.id in (select id from article where title like '%hello%')
- gt
某个filed
的值要大于给定的值。示例代码如下:
articles = Articles.objects.filter(id__gt=4)
以上代码的意思是将所有id>4
的文章全部找出来
将翻译成以下SQL
语句
select * from Articles where id > 4;
- gte
类似于gt
, 是大于等于
- lt
类似于gt
, 是小于
- lte
类似于get
,是小于等于
- startswith
判断某个字段的值是否是以某个值开始的。大小写敏感。示例代码如下:
articles = Article.objects.filter(title__startswith='hello')
以上代码的意思是提取所有标题以hello
字符串开头的文章
将翻译成以下SQL
语句
select * from article where title like 'hello%'
- istartswith
类似于startswith
, 但是大小写不敏感
- endswith
判断某个字段是否是以某个值结束。大小写敏感。示例代码如下:
articles = Article.objects.filter(title__endswith='hello')
以上代码的意思是提取所有标题以hello
字符串结尾的文章
将翻译成以下SQL
语句
select * from article where title like '%hello'
- iendswith
类似于endswith
, 但是大小写不敏感
- range
判断某个field
的值是否在给定的区间中。示例代码如下:
from django.utils.timezone import make_aware from datetime import datetime start_date = make_aware(datetime(year=2020, month=3, day=1)) end_date = make_aware(datetime(year=2020, month=3, day=31)) articles =Article.objects.filter(pub_date__range=(start_date, end_date))
将翻译成以下的SQL
语句
select * from article where pub_date between '2020-03-01' and '2020-03-31'
注意: 以上提取数据, 不会包含最后一个值。也就是不会包含
2020-03-31
的文章
- date
针对某些date
或者datetime
类型的字段。可以指定date
的范围。并且这个时间过滤还可以使用链式调用。示例代码如下:
articles = Article.objects.filter(pub_date__date = date(2020, 3, 1))
以上代码的意思是查找时间为2018/3/1
这一天发布的所有文章
year
根据年份进行查找。示例代码如下:
articles = Articles.objects.filter(pub_date__year=2020)
articles = Articles.objects.filter(pub_date__year__gte=2020)
以上代码在翻译成SQL
语句如下:
select * from article where pub_date between '2020-01-01' and '2020-12-31' select * from article where pub_date >= '2020-01-01'
- month
同year
, 按月份进行查找
- day
同year
, 按日期进行查找
- time
根据时间进行查找。示例代码如下:
articles = Article.objects.filter(pub_date__time=datetime.time(12, 12, 12))
以上代码是获取每一天中12点12分12秒发布的所有文章
更多的关于时间过滤, 请参考
Django
官方文档:https://docs.djangoproject.com/en/2.0/ref/models/querysets/#range
- isnull
根据值是否为空进行查找。示例代码如下:
articles = Article.objects.filter(pub_date__isnull=False)
以上代码的意思是获取所有发布日期不为空的文章
regex和iregex
大小写敏感和大小写不敏感的正则表达式。示例代码如下:
articles = Article.objects.filter(title__regex='^hello')
iregex
是大小写不敏感的
以上代码的意思是提取所有标题以hello
字符串开头的文章
iregex
是大小写不敏感的
根据关联的表进行查询
假如现在有两个ORM
模型, 一个是Article
, 一个是Category
。代码如下:
class Category(models.Model): """ 文章分类表 """ name = models.CharField(max_length=100) class Article(models.Model): """ 文章表 """ title = models.CharField(max_length=200) category = models.ForeignKey('Category', on_delete=models.CASCADE)
比如想要获取文章标题中包含"hello"的所有的分类。那么可以通过以下代码来实现:
categories = Category.object.filter(article_title__contains("hello"))
聚合函数
如果想要使用聚合函数来提取数据。比如提取某个商品销售的数据, 那么可以使用Count
, 如果想要知道商品销售的平均价格, 那么可以使用Avg
聚合函数是通过aggregate
方法来实现的。
1. Avg
: 求平均值。比如想要获取所有图书的价格平均值。那么可以使用以下代码
from django.db.models import Avg result = Book.objects.aggregate(Avg('price')) # 输出结果 {'price_avg':23.0}
其中price_avg
的结构是根据field_avg
规则构成的。如果想要修改默认的名字, 那么可以将Avg
赋给一个关键字参数。示例代码如下:
from django.db.models import Avg result = Book.objects.aggregate(my_avg=Avg('price')) # 输出结果 {'my_avg':23.0}
2. Count
: 获取指定的对象的个数。示例代码如下:
from django.db.models import Count result = Book.objects.aggregate(book_num=Count('id'))
以上的result
将返回book
表总共有多少本图书
Count
类中, 还有另外一个参数叫做distinct
, 默认是等于False
, 如果等于True
, 那么将去掉那些重复的值。比如要获取作者表中的不重复的邮箱的个数。那么可以通过以下代码来实现。
from django.db.models import Count result = Author.objects.aggregate(count=Count('email', distict=True))
3. Max
和Min
: 获取指定对的最大值和最小值。比如想要获取Author
表中, 最大年龄和最小年龄分别是多少。那么可以通过以下代码来实现
from django.db.models import Max, Min result = Author.objects.aggregate(Max('age'), Min('age'))
4. Sum
: 求指定对象的总和。比如要求图书的销售总额。那么可以使用以下代码实现
from django.db.moelds import Sum result = Book.objects.annotate(total=Sum('bookstore__price').value('name', 'total'))
以上代码annote
的意思是给Book
表在查询的时候添加一个字段叫做total
, 这个字段的数据来源是从BookStore
模型的price
的总和而来。values
方法是只提取name
和total
两个字段的值
更多的聚合函数请参考官方文档:
https://docs.djangoproject.com/en/2.0/ref/models/querysets/#aggregation-functions
aggragate和annotate的区别
-
aggragate
: 返回使用聚合函数后的字段和值 -
annote
: 在原来模型字段的基础之上添加一个使用了聚合函数的字段, 并且在使用聚合函数的时候, 会使当前这个模型的主键进行分组(group by)比如以上
Sum
的例子, 如果使用的是annotate
, 那么将在每条图书的数据上都添加一个字段叫做total
, 计算这本书的销售总额而如果使用的是
aggregate
, 那么将求所有图书的销售总额
F表达式和Q表达式
F表达式
F表达式
是用来优化ORM
操作数据库的。比如我们要将公司所有员工的薪水都增加1000元, 如果按照正常的流程, 应该是先从数据库中提取所有的员工工资到Python内存中。然后使用Python代码在员工工资的基础上增加1000元, 最后再保存到数据库中。这里面涉及的流程就是, 首先从数据库中提取数据到Python内存中, 然后在Python内存做完运算, 之后再保存到数据库中。示例代码如下:
employees = Employee.objects.all() for employee in employees: employess.salary += 1000 employess.save()
而我们的F表达式
就可以优化这个流程, 他可以不需要先把数据从数据库中提取出来, 计算完成后再保存回去, 他可以直接执行SQL语句
, 就将员工的工资增加1000元。示例代码如下:
from django.db.models import F Employ.object.update(salary=F("salary")+1000)
F表达式
并不会马上从数据库中获取数据, 而是在生成SQL
语句的时候, 动态的获取传给F表达式
的值。
比如想获取作者中, name
和email
相同的作者数据。如果不使用F表达式
, 那么需要使用如下代码:
authors = Author.objects.all() for author in authors: if author.name == author.email: print(author)
如果使用F表达式
, 那么一行代码就可以搞定。示例代码如下:
from django.db.models import F authors = Author.objects.filter(name=F('email'))
Q表达式
如果想要实现所有价格高于100元, 并且评分在9.0以上评分的图书。那么可以通过以下代码来实现
books = Book.objects.filter(price__gte=100, rating__gte=9)
以上这个案例是一个并集查询, 可以简单的通过传递多个条件进去来实现
但是如果想要实现一些复杂的查询语句, 比如要查询所有价格低于10元, 或者是评分低于9分的图书。那就没有办法通过传递多个条件进去实现了。这时候就需要使用Q表达式
来实现了。示例代码如下
from django.db.models import Q books = Book.objects.filter(Q(price__lte=10)|Q(rating__lte=9))
以上是进行或运算, 当然还可以进行其他的运行, 比如有&(和)
和~(非)
等。一些用Q
表达式的例子如下:
from django.db.models import Q # 获取id等于3的图书 books = Book.objects.filter(Q(id=3)) # 获取id等于3, 或者名字中包含文字"记"的图书 books = Book.objects.filter(Q(id=3)|Q(name__contains("记"))) # 获取价格大于100, 并且书名字包含"记"的图书 books = Book.objects.filter(Q(price__get)&Q(name__contains("记"))) # 获取书名包含"记", 但是id不等于3的图书 books = Book.objects.filter(Q(name__contains="记")&~Q(id=3))
QuerySet API
我们通常做查询操作的时候, 都是通过模型名字.objects
的方式进行操作。其实模型名字.objects
是一个Django.db.models.Manager
对象, 而Manager
这个类是一个"空壳"的类, 它本身是没有任何属性和方法的。它的方法全部都是通过Python
动态添加的方式, 从QuerySet
类中拷贝过来的。
class Manager(BaseManager.from_queryset(QuerySet)): pass class BaseManager: @classmethod def from_queryset(cls, queryset_class, class_name=None): if class_name is None: class_name = '%sFrom%s' % (cls.__name__, queryset_class.__name__) return type(class_name, (cls,), { '_queryset_class': queryset_class, **cls._get_queryset_methods(queryset_class), })
1. cls=BaseManager queryset_class = QuerySet 2. class_name = 'BaseManagerFromQuerySet'# type动态的时候创建类
# 第一个参数是用来指定创建的类的名字, 创建的类名是: 'BaseManagerFromQuerySet'
# 第二个参数是用来指定这个类的父类
# 第三个参数是用来指定这个类的一些属性和方法
3. return type(class_name, (cls, ), class_dict)
所以我们想要学习ORM
模型的查询操作, 必须首先要学会QuerySet
上的一些API
的使用
返回新的QuerySet的方法
在使用QuerySet
进行查询操作的时候, 可以提供多种操作。比如过滤完后还要根据某个字段进行排序, 那么这一系列的操作我们可以通过一个非常流畅的链式调用
的方式进行。比如从文章表中获取标题为123
, 并且提取后要将结果根据发布时间继续排序。那么可以使用以下的方式来完成:
articles = Article.objects.filter(title='123').order_by('create_time')
可以看到order_by
方法是直接在filter
执行后调用的。这说明filter
返回的对象是一个拥有order_by
方法的对象。而这个对象正是一个新的QuerySet
对象。因此可以使用order_by
方法。
那么以下将介绍在那些会返回新的QuerySet
对象的方法进行
filter
: 将满足条件的数据提取出来, 返回一个新的QuerySet
。-
exclude
: 排除满足条件的数据, 返回一个新的QuerySet
, 示例代码如下:
Article.objects.exclude(title__contains='hello')
-
annote: 给QuerySet中的每个对象都添加一个使用查询表达式(聚合函数、F表达式、Q表达式、Func表达式等)新的字段
articles = Article.objects.annotate(author_name=F('author__name'))
以上代码将在每个对象中斗添加一个author_name
的字段, 用来显示这个文章作者的名字
order_by
: 指定将查询的结果根据某个字段进行排序。如果要倒序排序, 那么可以在这个字段的前面加一个负号。示例代码如下:
# 根据创建的时间正序排序 articles = Article.objects.order_by('create_time') # 根据创建的时间倒序排序 articles = Article.objects.order_by('-create_time') # 根据作者的名字进行排序 articles = Article.objects.order_by('author__name') # 首先根据创建的时间进行排序, 如果时间相同。则根据作者的名字进行排序 articles = Article.objects.order_by('create_time', 'author__name')
注意: 如果多个
order_by
会把前面排序的规则打乱, 而使用后面的排序方式。比如如下代码articles = Article.objects.order_by('create_time').order_by('author__name')他会根据作者的名字进行排序, 而不是使用文章的创建时间
values
: 用来指定在提取数据出来, 需要提取哪些字段。默认情况下会把表中所有的字段全部提取出来, 可以使用values
来进制指定, 并且使用了values
方法后,提取出的QuerySet
中的数据类型不是模型, 而是在values
方法中指定的字段和值形成的字典
articles = Article.objects.value('title', 'content') for article import articles: print(article)
以上打印出来的article
是类似于{'title':'abc', 'content':'xxx'}
的形式
如果在values
中没有传递任何参数, 那么将会返回这个模型中的所有的属性
values_list
: 类似于values
。只不过返回的QuerySet
中, 存储的不是字典, 而是元组。示例代码如下:
articles = Article.objects.values_list('id', 'title') print(articles)
那么在打印articles
后, 结果为<QuerySet[(1, 'abc'), (2, 'xxx'),...]>
等。
如果在values_list
中只有一个字段。那么可以传递flat=True
来将结果进行扁平化。示例代码如下:
articles1 = Article.objects.values_list('title') >>> <QuerySet[('abc', ), ('xxx', ),...]> articles1 = Article.objects.values_list('title', flat=True) >>> <QuerySet['abc', 'xxx', ...]>
all
: 获取这个ORM
模型的QuerySet
对象select_related
: 在提取某个模型的数据的同时,也提前将相关联的数据提取出来。比如提取文章数据,可以使用select_related
将author
信息提取出来,以后再次使用article.author
的时候就不需要再次去访问数据库了。可以减少数据库查询的次数。示例代码如下:
article = Article.objects.get(pk=1) >> article.author # 重新执行一次查询语句 article = Article.objects.select_related("author").get(pk=2) >> article.author # 不需要重新执行查询语句了
selected_related
只能用在一对多
或者一对一
中,不能用在多对多
或者多对一
中。比如可以提前获取文章的作者,但是不能通过作者获取这个作者的文章,或者是通过某篇文章获取这个文章所有的标签。
prefetch_related
:这个方法和select_related
非常的类似,就是在访问多个表中的数据的时候,减少查询的次数。这个方法是为了解决多对一
和多对多
的关系的查询问题。比如要获取标题中带有hello
字符串的文章以及他的所有标签,示例代码如下:
from django.db import connection articles = Article.objects.prefetch_related("tag_set").filter(title__contains='hello') print(articles.query) # 通过这条命令查看在底层的SQL语句 for article in articles: print("title:",article.title) print(article.tag_set.all()) # 通过以下代码可以看出以上代码执行的sql语句 for sql in connection.queries: print(sql)
但是如果在使用article.tag_set
的时候,如果又创建了一个新的QuerySet
那么会把之前的SQL
优化给破坏掉。比如以下代码:
tags = Tag.obejcts.prefetch_related("articles") for tag in tags: articles = tag.articles.filter(title__contains='hello') #因为filter方法会重新生成一个QuerySet,因此会破坏掉之前的sql优化 # 通过以下代码,我们可以看到在使用了filter的,他的sql查询会更多,而没有使用filter的,只有两次sql查询 for sql in connection.queries: print(sql)
那如果确实是想要在查询的时候指定过滤条件该如何做呢,这时候我们可以使用django.db.models.Prefetch
来实现,Prefetch
这个可以提前定义好queryset
。示例代码如下:
tags = Tag.objects.prefetch_related(Prefetch("articles",queryset=Article.objects.filter(title__contains='hello'))).all() for tag in tags: articles = tag.articles.all() for article in articles: print(article) for sql in connection.queries: print('='*30) print(sql)
因为使用了Prefetch
,即使在查询文章的时候使用了filter
,也只会发生两次查询操作
defer
:在一些表中,可能存在很多的字段,但是一些字段的数据量可能是比较庞大的,而此时你又不需要,比如我们在获取文章列表的时候,文章的内容我们是不需要的,因此这时候我们就可以使用defer
来过滤掉一些字段。这个字段跟values
有点类似,只不过defer
返回的不是字典,而是模型。示例代码如下:
articles = list(Article.objects.defer("title")) for sql in connection.queries: print('='*30) print(sql)
articles = list(Article.objects.defer("title")) for article in articles: # 因为在上面提取的时候过滤了title # 这个地方重新获取title,将重新向数据库中进行一次查找操作 print(article.title) for sql in connection.queries: print('='*30) print(sql)
defer
虽然能过滤字段,但是有些字段是不能过滤的,比如id
,即使你过滤了,也会提取出来。
only
:跟defer
类似,只不过defer
是过滤掉指定的字段,而only
是只提取指定的字段。get
:获取满足条件的数据。这个函数只能返回一条数据,并且如果给的条件有多条数据,那么这个方法会抛出MultipleObjectsReturned
错误,如果给的条件没有任何数据,那么就会抛出DoesNotExit
错误。所以这个方法在获取数据的只能,只能有且只有一条。create
:创建一条数据,并且保存到数据库中。这个方法相当于先用指定的模型创建一个对象,然后再调用这个对象的save
方法。示例代码如下:
article = Article(title='abc') article.save() # 下面这行代码相当于以上两行代码 article = Article.objects.create(title='abc')
get_or_create
:根据某个条件进行查找,如果找到了那么就返回这条数据,如果没有查找到,那么就创建一个。示例代码如下:
obj,created= Category.objects.get_or_create(title='默认分类')
如果有标题等于默认分类
的分类,那么就会查找出来,如果没有,则会创建并且存储到数据库中。 这个方法的返回值是一个元组,元组的第一个参数obj
是这个对象,第二个参数created
代表是否创建的。
bulk_create
: 一次性创建多个数据。示例代码如下:
Tag.objects.bulk_create([ Tag(name='111'), Tag(name='222'), ])
count
:获取提取的数据的个数。如果想要知道总共有多少条数据,那么建议使用count
,而不是使用len(articles)
这种。因为count
在底层是使用select count(*)
来实现的,这种方式比使用len
函数更加的高效。first
和last
:返回QuerySet
中的第一条和最后一条数据。aggregate
:使用聚合函数
exists
:判断某个条件的数据是否存在。如果要判断某个条件的元素是否存在,那么建议使用exists
,这比使用count
或者直接判断QuerySet
更有效得多。示例代码如下:
if Article.objects.filter(title__contains='hello').exists(): print(True) 比使用count更高效: if Article.objects.filter(title__contains='hello').count() > 0: print(True) 也比直接判断QuerySet更高效: if Article.objects.filter(title__contains='hello'): print(True)
distinct
:去除掉那些重复的数据。这个方法如果底层数据库用的是MySQL
,那么不能传递任何的参数。比如想要提取所有销售的价格超过80元的图书,并且删掉那些重复的,那么可以使用distinct
来帮我们实现,示例代码如下:
books = Book.objects.filter(bookorder__price__gte=80).distinct()
需要注意的是,如果在distinct
之前使用了order_by
,那么因为order_by
会提取order_by
中指定的字段,因此再使用distinct
就会根据多个字段来进行唯一化,所以就不会把那些重复的数据删掉。示例代码如下:
orders = BookOrder.objects.order_by("create_time").values("book_id").distinct()
那么以上代码因为使用了order_by
,即使使用了distinct
,也会把重复的book_id
提取出来
update
:执行更新操作,在SQL
底层走的也是update
命令。比如要将所有category
为空的article
的article
字段都更新为默认的分类。示例代码如下
Article.objects.filter(category__isnull=True).update(category_id=3)
注意这个方法走的是更新的逻辑。所以更新完成后保存到数据库中不会执行
save
方法,因此不会更新auto_now
设置的字段。
-
delete
:删除所有满足条件的数据。删除数据的时候,要注意on_delete
books = Book.objects.all()[1:3] for book in books: print(book)
切片操作并不是把所有数据从数据库中提取出来再做切片操作。而是在数据库层面使用LIMIE
和OFFSET
来帮我们完成。所以如果只需要取其中一部分的数据的时候,建议大家使用切片操作。
什么时候Django
会将QuerySet
转换为SQL
去执行
books = Book.objects.all() print(connection.queries)
我们可以看到在打印connection.quries
的时候打印的是一个空的列表。说明上面的QuerySet
并没有真正的执行。 在以下情况下QuerySet
会被转换为SQL
语句执行:
1. 迭代:在遍历QuerySet
对象的时候,会首先先执行这个SQL
语句,然后再把这个结果返回进行迭代。比如以下代码就会转换为SQL
语句
for book in Book.objects.all(): print(book)
2. 使用步长做切片操作:QuerySet
可以类似于列表一样做切片操作。做切片操作本身不会执行SQL
语句,但是如果如果在做切片操作的时候提供了步长,那么就会立马执行SQL
语句。需要注意的是,做切片后不能再执行filter
方法,否则会报错。
3. 调用len
函数:调用len
函数用来获取QuerySet
中总共有多少条数据也会执行SQL
语句。
4. 调用list
函数:调用list
函数用来将一个QuerySet
对象转换为list
对象也会立马执行SQL
语句。
5. 判断:如果对某个QuerySet
进行判断,也会立马执行SQL
语句。
ORM模型迁移
迁移命令
1. makemigrations:将模型生成迁移脚本。模型所在的app
,必须放在settings.py
中的INSTALLED_APPS
中。这个命令有以下几个常用选项:
- app_label:后面可以跟一个或者多个
app
,那么就只会针对这几个app生成迁移脚本。如果没有任何的app_label,那么会检查INSTALLED_APPS
中所有的app下的模型,针对每一个app都生成响应的迁移脚本。 - --name:给这个迁移脚本指定一个名字。
- --empty:生成一个空的迁移脚本。如果你想写自己的迁移脚本,可以使用这个命令来实现一个空的文件,然后自己再在文件中写迁移脚本
2. migrate:将新生成的迁移脚本。映射到数据库中。创建新的表或者修改表的结构。以下一些常用的选项:
- app_label:将某个
app
下的迁移脚本映射到数据库中。如果没有指定,那么会将所有在INSTALLED_APPS
中的app
下的模型都映射到数据库中。 - app_label migrationname:将某个
app
下指定名字的migration
文件映射到数据库中。 - --fake:可以将指定的迁移脚本名字添加到数据库中。但是并不会把迁移脚本转换为SQL语句,修改数据库中的表。
- --fake-initial:将第一次生成的迁移文件版本号记录在数据库中。但并不会真正的执行迁移脚本
3. showmigrations:查看某个app下的迁移文件。如果后面没有app,那么将查看INSTALLED_APPS
中所有的迁移文件
4. sqlmigrate:查看某个迁移文件在映射到数据库中的时候,转换的SQL
语句。
migrations中的迁移版本和数据库中的迁移版本对不上怎么办?
1. 找到哪里不一致,然后使用python manage.py --fake [版本名字]
,将这个版本标记为已经映射。
2. 删除指定app
下migrations
和数据库表django_migrations
中和这个app
相关的版本号,然后将模型中的字段和数据库中的字段保持一致,再使用命令python manage.py makemigrations
重新生成一个初始化的迁移脚本,之后再使用命令python manage.py makemigrations --fake-initial
来将这个初始化的迁移脚本标记为已经映射。以后再修改就没有问题了。
根据已有表自动生成模型
在实际开发中,有些时候可能数据库已经存在了。如果我们用Django
来开发一个网站,读取的是之前已经存在的数据库中的数据。那么该如何将模型与数据库中的表映射呢?根据旧的数据库生成对应的ORM
模型,需要以下几个步骤:
1. Django
给我们提供了一个inspectdb
的命令,可以非常方便的将已经存在的表,自动的生成模型。想要使用inspectdb
自动将表生成模型。首先需要在settings.py
中配置好数据库相关信息。不然就找不到数据库。示例代码如下:
DATABASES = { 'default': { 'ENGINE': 'django.db.backends.mysql', 'NAME': "migrations_demo", 'HOST': '127.0.0.1', 'PORT': '3306', 'USER': 'root', 'PASSWORD': 'root' } }
那么通过python manage.py inspectdb
,就会将表转换为模型后的代码,显示在终端
以上代码只是显示在终端。如果想要保存到文件中。那么可以使用>
重定向输出到指定的文件。比如让他输出到models.py
文件中。示例命令如下:
python manage.py inspectdb > models.py
以上的命令,只能在终端执行,不能在pycharm->Tools->Run manage.py Task...
中使用。
如果只是想要转换一个表为模型。那么可以指定表的名字。示例命令如下:
python manage.py inspectdb article_article > models.py
2. 修正模型:新生成的ORM
模型有些地方可能不太适合使用。比如模型的名字,表之间的关系等等。那么以下选项还需要重新配置一下:
-
模型名:自动生成的模型,是根据表的名字生成的,可能不是你想要的。这时候模型的名字你可以改成任何你想要的。
-
模型所属app:根据自己的需要,将相应的模型放在对应的app中。放在同一个app中也是没有任何问题的。只是不方便管理。
-
模型外键引用:将所有使用
ForeignKey
的地方,模型引用都改成字符串。这样不会产生模型顺序的问题。另外,如果引用的模型已经移动到其他的app中了,那么还要加上这个app的前缀。 -
让Django管理模型:将
Meta
下的managed=False
删掉,如果保留这个,那么以后这个模型有任何的修改,使用migrate
都不会映射到数据库中。 -
当有多对多的时候,应该也要修正模型。将中间表注视了,然后使用
ManyToManyField
来实现多对多。并且,使用ManyToManyField
生成的中间表的名字可能和数据库中那个中间表的名字不一致,这时候肯定就不能正常连接了。那么可以通过db_table
来指定中间表的名字。 -
表名:切记不要修改表的名字。不然映射到数据库中,会发生找不到对应表的错误
3. 执行命令python manage.py makemigrations
生成初始化的迁移脚本。方便后面通过ORM
来管理表。这时候还需要执行命令python manage.py migrate --fake-initial
,因为如果不使用--fake-initial
,那么会将迁移脚本会映射到数据库中。这时候迁移脚本会新创建表,而这个表之前是已经存在了的,所以肯定会报错。此时我们只要将这个0001-initial
的状态修改为已经映射,而不真正执行映射,下次再migrate
的时候,就会忽略他。
4. 将Django
的核心表映射到数据库中:Django
中还有一些核心的表也是需要创建的。不然有些功能是用不了的。比如auth
相关表。如果这个数据库之前就是使用Django
开发的,那么这些表就已经存在了。可以不用管了。如果之前这个数据库不是使用Django
开发的,那么应该使用migrate
命令将Django
中的核心模型映射到数据库中。