Django -- ORM

什么是orm？

MVC框架中重要的一部分就是ORM，实现了数据模型与数据库的解耦，即数据模型不需要依赖于特定的数据库，通过简单的配置就可以轻松更换数据库。

ORM是对象关系映射的简称，主要任务是：

根据对象的类型生成表结构
将对象、列表操作，转换成SQL语句（或其他数据库的语句）
将SQL查询到的结果转换为对象、列表
类名对应 ------> 数据库中的表名
类属性对应 -----> 数据库里的字段
类实例对应 -------> 数据库表里的一行数

ORM的优势：

ORM使得我们的通用数据库交互变得简单易行，而且完全不用考虑该死的SQL语句。快速开发，由此而来。
可以避免一些新手程序猿写sql语句带来的性能问题。
如果数据库迁移，只需要更换Django的数据库引擎即可。

ORM的缺点：

性能有所牺牲，不过现在的各种ORM框架都在尝试各种方法，比如缓存，延迟加载登来减轻这个问题。效果很显著。
对于个别复杂查询，ORM仍然力不从心，为了解决这个问题，ORM一般也支持写raw sql。
通过QuerySet的query属性查询对应操作的sql语句

数据库的配置

1.默认支持

Django默认支持sqlite，mysql, oracle,postgresql数据库。默认使用sqlite的数据库，默认自带sqlite的数据库驱动 , 引擎名称：django.db.backends.sqlite3。

2.mysql驱动程序

MySQLdb(mysql python)【python2中的驱动】
mysqlclient
MySQL
PyMySQL(纯python的mysql驱动程序)【python3中的驱动】

3.创建数据库

配置前必须先创建数据库

create database Django_books charset utf8；  #创建支持中文的数据库

4.更改项目中settings.py的数据库设置

DATABASES = {
    'default': {
        'ENGINE': 'django.db.backends.mysql',
        'NAME': 'Django_Books',         #你的数据库名称
        'USER': 'root',          #你的数据库用户名
        'PASSWORD': '123456',     #你的数据库密码
        'HOST': 'localhost',       #你的数据库主机，留空默认为localhost
        'PORT': '3306',          #你的数据库端口
    }
}

5.配置驱动

Django默认导入的驱动是MySQLdb，MySQLdb对python3的支持有很大问题，所以要换成PyMySQL：在项目名文件夹下的__init__.py中：

import pymysql
pymysql.install_as_MySQLdb()    # 告诉Django使用pymysql驱动程序

扩展：查看ORM操作执行的原生sql语句，在settings.py中增加：

LOGGING = {
    'version': 1,
    'disable_existing_loggers': False,
    'handlers': {
        'console':{
            'level':'DEBUG',
            'class':'logging.StreamHandler',
        },
    },
    'loggers': {
        'django.db.backends': {
            'handlers': ['console'],
            'propagate': True,
            'level':'DEBUG',
        },
    }
}

表（模型）的创建

示例：作者、书籍和出版社之间的关系

from django.db import models
 
class Book(models.Model):
    name = models.CharField(max_length=20)
    price = models.IntegerField()
    pub_data = models.DateField()
    author = models.ManyToManyField("Author")
    publish = models.ForeignKey("Publish",on_delete=models.CASCADE)
 
class Author(models.Model):
    name = models.CharField(max_length=32)
    sex = models.BooleanField(max_length=1,choices=((0,"男"),(1,"女"),))
    phone = models.CharField(max_length=11)
 
class Publish(models.Model):
    name = models.CharField(max_length=30)
    address = models.CharField("地址",max_length=150)

1.每个数据模型（类）都是django.db.models.Model的子类，它的父类Model包含了所有必要的和数据库交互的方法。

2.每个类就相当于单个数据表，属性名就是字段名

字段类型介绍

AutoField　　自增列 = int(11)  如果没有的话，默认会生成一个名称为 id 的列，如果要显示的自定义一个自增列，必须将给列设置为主键 primary_key=True。
CharField　　字符串字段           必须有 max_length 参数
BooleanField　　布尔类型=tinyint(1)   不能为空，Blank=True
ComaSeparatedIntegerField　　用逗号分割的数字=varchar   继承CharField，所以必须 max_lenght 参数
DateField　　日期类型 date   对于参数，auto_now = True 则每次更新都会更新这个时间；auto_now_add 则只是第一次创建添加，之后的更新不再改变。
DateTimeField　　日期类型 datetime        同DateField的参数
Decimal　　十进制小数类型 = decimal     必须指定整数位max_digits和小数位decimal_places
EmailField　　字符串类型（正则表达式邮箱） =varchar    对字符串进行正则表达式
FloatField　　浮点类型 = double
IntegerField　　   整形
BigIntegerField　 长整形
　　不同的整型类型integer_field_ranges = {
　　　　'SmallIntegerField': (-32768, 32767),
　　　　'IntegerField': (-2147483648, 2147483647),
　　　　'BigIntegerField': (-9223372036854775808, 9223372036854775807),
　　　　'PositiveSmallIntegerField': (0, 32767),
　　　　'PositiveIntegerField': (0, 2147483647),
　　}
IPAddressField　　字符串类型（ip4正则表达式）(已弃用，用13、)
GenericIPAddressField　　字符串类型（ip4和ip6是可选的）参数protocol可以是：both、ipv4、ipv6
　　验证时，会根据设置报错
NullBooleanField　　允许为空的布尔类型
PositiveIntegerFiel　　正Integer
PositiveSmallIntegerField　　正smallInteger
SlugField　　减号、下划线、字母、数字
TextField　　字符串=longtext
TimeField　　时间 HH:MM[:ss[.uuuuuu]]
URLField　　字符串，地址正则表达式
BinaryField　　二进制
ImageField    图片
FilePathField  文件

3.字段参数介绍

null                  是否可以为空
default              默认值
primary_key       主键
choices：      一个用来选择值的2维元组。第一个值是实际存储的值，第二个用来方便进行选择。如：SEX_CHOICES= (( ‘F’,'Female’),(‘M’,'Male’),)
                             gender = models.CharField(max_length=2,choices = SEX_CHOICES)
db_column           列名
db_index             索引(db_index=True)
unique                 唯一索引(unique=True)
unique_for_date        只对日期索引
unique_for_month      只对月份索引
unique_for_year       只对年做索引
blank              django的 Admin 中添加数据时是否可允许空值
editable           如果为假，admin模式下将不能改写。缺省为真
verbose_name　　Admin中字段的显示名称
validator_list      有效性检查。非有效产生 django.core.validators.ValidationError 错误

4.模型之间的关系（表与表之间）

有三种关系：一对一，一对多，多对多

一对一：实质就是在主外键的关系基础上，给外键加了一个UNIQUE＝True的属性；OneToOne("UserGroup")

一对多：就是主外键关系；ForeignKeyField("UserGroup",to_field="gid",default=1,on_delete=models.CASCADE)

多对多：ORM会为我们自动创建第三张表(当然我们也可以自己创建第三张表：两个foreign key)；ManyToManyField("UserGroup")

参数：“UserGroup”　　　　关联的另一张表的表名；

　　　　to_field="gid" 　　　可省略。另外一张表的字段，默认是主键；

　　　　on_delete=models.CASCADE（

　　　　　　CASCADE:这就是默认的选项，级联删除，你无需显性指定它。
　　　　　　PROTECT: 保护模式，如果采用该选项，删除的时候，会抛出ProtectedError错误。
　　　　　　SET_NULL: 置空模式，删除的时候，外键字段被设置为空，前提就是blank=True, null=True,定义该字段的时候，允许为空。
　　　　　　SET_DEFAULT: 置默认值，删除的时候，外键字段设置为默认值，所以定义外键的时候注意加上一个默认值。）

5.建好表后，在命令行执行一下两条语句生成映射文件并提交数据库执行建表

python manage.py makemigrations   在应用文件夹内生成映射文件（000开头的py文件）
python manage.py migrate            提交数据库执行建表

表的操作

一.增添

增添表记录

单表：
create()方法：
        Book.objects.create(name="Python基础",price=100)
      或
        Book.objects.create(**{"name":"Python基础","price":"100"})
save()方法：
        b = Book(name="Python基础",price=100) # 创建对象
        b.save()         # 将对象存数据库
      或
        b = Book()
        b.name="Python基础"
        b.price=100
        b.save()
有外键时：
    Book.objects.create(name="",price="",pub_date="",publish_id=2)  # 外键关联表的id
  或
    objcet = Publish.objects.get();
    Book.objects.create(name="",price="",pub_date="",publish=object) # 外键=对象

增添多对多之间的关联关系

情景1：使用ManyToMany自动创建第三张表
    add()方法：【调用add的主体必须是单个model对象】
    例如：为已有的一本书增添作者
            author_obj = Author.objects.filter(name="alex")
            book_obj = Book.objects.get(id=2)
            book_obj.author.add(*author_obj)  这里的author指的是Author表。添加一个列表*  添加一个字典**
            或：
            book_obj = Book.objects.filter(name="Python")
            author_obj = Author.object.get(id=1)
            author_obj.book_set.add(*book_obj)    这里的book指的是Book表。
            注意两种方式 _set 的区别，源于models.py中建表的author字段
情景2：自己手动创建的第三张表BookToAuthor
    models.BookToAuthor.objects.create(author_id=1,Book_id=2)

二.删除

删除表记录

Book.objects.filter(name="Python").delete()  # 看上去删除了一条消息，实际上还删除了book_author表中的数据， 这是django默认的级联删除

删除多对多之间的关联关系

clear()和remove()方法 【调用这两种方法的主体必须是单个对象】
    remove()方法： remove方法用来删除某个对象和某些对象的关联关系
            为已有的一本书删除某个作者
            author_obj = Author.objects.filter(name="alex")
            book_obj = Book.objects.get(name="Python")
            book_obj.author.remove(*author_obj)     remove(3) 意思是删除id=3的作者与本书的关系
            或：
            book_obj = Book.objects.filter(name="Python")
            author_obj = Author.object.get(name="Python")
            author_obj.book_set.remove(*book_obj)   
     
     clear()方法： clear方法用来删除某个对象和所有对象的关联关系
            book_obj.author.remove(*author_obj)   删除作者alex和Python书之间的关联
            book_obj.author.clear()               删除Python和所有作者的关联
            author_obj[0].book_set.clear()        删除作者alex和所有书的关联
注意：当clear()方法和remove()应用在ForeignKey上时，必需null=True才能用

三.修改

修改表数据

update()方法：
   Book.objects.filter(author="yuan").update(price=100)
save()方法：
   b = Book.objects.get(author="oldboy")
   b.price = 200
   b.save()
 
需要注意：
1.update()是QuerySet对象的方法，而save()是model对象的方法。即update可以一次性修改多条记录的数据，并返回一个整型数值，表示受影响的记录条数。而save一次只能修改一条记录
2.save() 方法会将所有属性重新设定一遍，效率低。而update只更改指定的属性，所以修改数据推荐用update

如果要修改多对多表之间的关系：

没有专门的方法，可以将remove()和add()组合使用

四.查询

1.查询API：

查询API:
filter(**kwargs)     它包含了与所给筛选条件相匹配的对象
all()                 查询所有结果
get(**kwargs)         返回与所给筛选条件相匹配的对象，返回结果有且只有一个，如果符合筛选条件的对象超过一个或者没有都会抛出错误。
  
下面的方法都是对查询的结果再进行处理：比如 objects.filter.values()
values(*field)        返回一个ValueQuerySet——一个特殊的QuerySet，运行后得到的并不是一系列model的实例化对象，而是一个可迭代的字典序列
values_list(*field)   它与values()非常相似，它返回的是一个元组序列，values返回的是一个字典序列
exclude(**kwargs)     它包含了与所给筛选条件不匹配的对象
order_by(*field)      对查询结果排序,例如order_by("price")按照价格从小到大排序，order_by("-price")从大到小排序
reverse()             对查询结果反向排序
distinct()            从返回结果中剔除重复纪录
count()               返回数据库中匹配查询(QuerySet)的对象数量。
first()               返回第一条记录
last()                返回最后一条记录
exists()              如果QuerySet包含数据，就返回True，否则返回False。不会保存在缓存里。

扩展查询：有时候Django的查询API不能方便地设置查询条件，提供了另外的扩展查询方法extra()

extra(select=None, where=None, params=None, tables=None,order_by=None, select_params=None)
extra可以指定一个或多个参数，都不是必需的，但要至少使用一个。
参数详解：
    1.select和select_params
        select这个参数内可以直接写SQL查询语句或者函数，select_params用来给select中的语句传值
        例：
            v = models.Publish.objects.all().extra(select={
                'n':"select count(1) from app01_book WHERE id=%s or id=%s",
                'm':"select count(1) from app01_author WHERE id=%s or id=%s",
            },select_params=(1,2,3,4))
            这里取到了所有Publish表中的数据，同时还取到了以下两个SQL语句中的东西。
            for i in v:
                print(i.n,i.m,i.id)
    2.where和params
        where用来直接写查询条件，parems给where中传值
            例：
            models.Book.objects.extra(where=['parice=%s'], params=['99'])
            models.Book.objects.extra(where=["'parice=100' OR name='Python'","id=1" ])
    3.tables用来查询整张表
        例：
        models.Author.objects.extra(tables=["app01_book"])
        <=> select * from app01_book,app01_author
        models.Book.objects.extra(tables=["app01_author"],where=["app01_book.id = app01_author.id"]) <=> select * from app01_book,app01_author where app01_book.id = app01_author.id
    4.order_by用来排序
  
综合示例1：
    models.Author.objects.extra(
        select={"newid":"select count(1) from app01_book where id>%s"},
        select_params=[1,],
        where=["args>%s"],
        params=[18,],
        order_by=["-ages"],
    )
    <=>
    select
        app01_author.id,
        (select count(1) from app01_book where id>1) as newid
    from app01_author,app01_book
    where
        app01_author.age > 18
    order by
        app01_author.age desc
综合示例2：
    models.Article.objects.all().filter(user=current_user).extra(select={"filter_create_date":"strftime(‘%%Y/%%m‘,create_time)"}).values_list("filter_create_date")
    #查出当前用户的所有文章的create_time，并且只取出年份和月份

单表模糊查询：（双下划线）

万能的 __双下划线
    __gt    大于
    __gte  大于等于
    __lt     小于
    __lte   小于等于
    __icontains="p"    含有p且不区分大小写
    __contains="p"     含有p且区分大小写
    __exat="aaa"       相当于 like "aaa"
    __iexat="aaa"      相当于忽略大小写 like "aaa"
    _in=[10,20,33,50]      获取id等于10,20,33,50的数据
    __exclude(id_in=[])   不等于10 20 33 50的
    __range=[1,2]    在范围内的
    __startswith        以...开头
    __istartswith       不以...开头
    __endswith         以...结尾
    __iendswith        不以...结尾
    __year         日期字段的年份
    __month       日期字段的月份
    __day           日期字段的日
    __isnull=True/False
 
 
filter(price__gt=100)         筛选价格大于100的
filter(id__gt=1,id__lt=10)  id大于1小于10

2.多表关联查询：（多对多和一对多没有区别）

1.查多条记录（__ 双下划线）
      找到Python这本书的出版社名称
      Book.objects.filter(name="Python").values("publish__name")   通过外键[publish是Book表的外键]
      Publish.objects.filter(book__name="Python").values("name")  通过对象[book是Publish关联的表名]
 
2.(只能查单条记录，不常用)
    正向查询（通过书查出版社）
       Book.objects.get(name="").publish  --> 出版社对象
       print(publish.属性)
    反向查询（通过出版社找书）
       Publish.objects.get(name="").book_set.all() -->所有的书籍对象
            注意：book_set 是模型对象中反向查询的语法,book是表名，全部小写
                    调用 _set 的主体必须是单个对象！！

3.Queryset的惰性机制

所谓惰性机制，models查询语句只是返回了一个Queryset对象，并不会马上执行SQL，而是使用查询结果的时候才执行。

例如：person_set = Person.objects.filter(first_name="Dave")这句话并没有运行数据库查询，当遍历Queryset、if queryset或者在模板渲染的时候使用的时候才会执行数据库查询操作

Qureyset的特点：可迭代、可切片、有缓存。

※ Queryset是有缓存的

当遍历Queryset时，匹配的记录会从数据库获取，然后转换成Django的model。这些model会保存在Queryset内置的缓存中，如果再次遍历或者使用这个Queryset时，不需要重复的查询。

而如果处理成千上万的记录时，一次性装入内存是非常浪费的。要避免产生Queryset缓存，可以使用iterator()方法来获取数据，处理完数据就将其丢弃。

objs = Book.objects.all().iterator()
for obj in objs:
    print(obj.name)

迭代器不能重复遍历，意味着可能会造成额外的重复查询。而缓存是用于减少对数据库的查询。所以使用时要考虑需求。

4.聚合查询的分组查询

from django.db.models import Avg,Min,Sum,Max,Count

聚合查询：aggregate(*args,**kwargs):

aggregate()是Queryset的一个终止子句，通过对Queryset进行计算，返回一个聚合值的字典。从整个查询集上生成聚合值。

aggregate()子句的参数描述了我们想要计算的聚合值，如平均Avg,求和Sum等

例如：

Book.objects.all().aggregate(Avg('price')) # 计算所有在售书的平均价钱
{'price__avg': 34.35}
Book.objects.aggregate(average_price=Avg('price')) # 自定义标识符（键）
{'average_price': 34.35}
Book.objects.aggregate(Avg('price'), Max('price'), Min('price')) # 同时输出多个聚合值
{'price__avg': 34.35, 'price__max': Decimal('81.20'), 'price__min': Decimal('12.99')}

分组查询： annotate(*args,**kwargs):

分组查询常常和聚合查询一起。它可以为查询集的每一项生成聚合。

# 查询每个作者出书的总价格，按照作者分组
Book.objects.all().values("authors__name").annotate(Sum("price"))
[{'authors__name':'alex','price_sum':'140'},{'authors__name':'alvin','price_sum':'160'}]
 
# 查询各个出版社最便宜的书的价格
Book.objects.all().values("pulisher__name").annotate(Min("price"))
[{'publisher__name':'清华大学出版社','price_min':'70'},{'publisher__name':'中国机械出版社','price_min':'90'}]

5.F查询和Q查询

from django.db.models import F,Q

F查询：就是用来更新获取原来值的功能

models.Author.objects.all().update(age=F("age")+1) # 将Author表里所有人的年龄+1
models.Book.objects.all().update(price=F("price")+10)  # 将所有书的价格涨10元

Q查询：用于构造复杂的查询条件，如与、或、非。

查询条件我们可以使用filter()方法，在filter()里面的两个条件之间是and的关系，如果是或的关系，则只能使用Q查询

Book.objects.filter(Q(id=1)) # 查询条件为id=1
Book.objects.filter(Q(price=99) | ~Q(name="Python")) # 查询价格=99 或 名称不等于Python的书
Book.objects.filter(Q(name="Go"),price=99)  # Q查询可以和关键字查询组合使用，但必须要将Q放到前面

posted @ 2019-01-30 20:08 苦行僧PH 阅读(186) 评论(0) 收藏举报

刷新页面返回顶部

苦行僧PH