SQLAlchemy 基础知识 - autoflush 和 autocommit（转）

原文：https://zhuanlan.zhihu.com/p/48994990

作者：Cosven

来源：知乎

这篇文章致力于解决以下疑问（本文以 MySQL 为例）：

SQLAlchemy 的 session 是指什么？
session 的 autoflush 参数是干什么的，我到底要不要开启它？
session 的 autocommit 参数又是什么，它和 autoflush 的区别是什么？
SQLAlchemy 是在何时发送 SQL 语句的？

附：

SQLAlchemy MySQL 调试小技巧

SQLAlchemy 基础

下面是一段官方 SQLAlchemy 使用示例，我们从这个例子出发，认识 SQLAlchemy。

from sqlalchemy import create_engine
from sqlalchemy import Column, Integer, String
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker


# sqlite3/mysql/postgres engine
# 请先自己在 MySQL 中创建一个名为 test_tmp 的 database
engine = create_engine('mysql://root@localhost/test_tmp', echo=False)

Base = declarative_base()

Session = sessionmaker(bind=engine)

session1 = Session()
session2 = Session()

SessionNoAutoflush = sessionmaker(bind=engine, autoflush=False)
session3 = SessionNoAutoflush()


class User(Base):
    __tablename__  = 'user'

    id = Column(Integer, primary_key=True)
    name = Column(String(64))

session 是什么？

目前还不知道怎样直接给 session 下定义，但是我们可以通过它的一些用途来认识它，在脑海里脑补出这个东西。

session 会在需要的时候（比如用户读取数据、更新数据时）和数据库进行通信，获取数据对象，并有一个池子来维护这些对象，保证你访问数据时不出现意外的问题
session 和连接(connection) 不等同，session 通过连接和数据库进行通信
session 是 Query 的入口，当你想要发起查询的时候，一般用法是：session.Query(Model).filter_by(...).first()

如果不完全理解它，也没关系，有个大概印象即可，以后碰到具体的问题再具体分析，到时候就可以针对性解决。

官方介绍 session 的资料：https://docs.sqlalchemy.org/en/20/orm/session_basics.html#what-does-the-session-do

autoflush 参数

首先，学习两个概念：flush 和 commit。

flush 的意思就是将当前 session 存在的变更发给数据库，换句话说，就是让数据库执行 SQL 语句。
commit 的意思是提交一个事务。一个事务里面可能有一条或者多条 SQL 语句
SQLAlchemy 在执行 commit 之前，肯定会执行 flush 操作；而在执行 flush 的时候，不一定执行 commit，这个主要视 autocommit 参数而定，后面会详细讲

当 autoflush 为 True 时（默认是 True），session 进行查询之前会自动把当前累计的修改发送到数据库（注意：autoflush 并不是说在 session.add 之后会自动 flush），举个例子（结合开始的代码）：

# 创建了一个对象，这时，这个对象几乎没有任何意义，session 不知道它的存在
>>> user = User(name='cosven')
>>> 
# session1.add 这个对象之后，它被 session 放到它的对象池里面去了，但这时不会发送任何 SQL 语句给数据库，数据库目前仍然不知道它的存在
>>>  session1.add(user)
>>>  
# session1.Query 执行之前，由于 autoflush 是 True，session1 会先执行 session1.flush()，然后再发送查询语句
# 当 session 进行 flush 操作时，session 会先建立（选）一个和数据库的连接，然后将创建 user 的 SQL 语句发送给数据库
# 所以，这个查询是能查到 user 的
>>> session1.query(User).filter_by(name='cosven').first()
<__main__.User object at 0x1108f04e0>

如果 session 的 autoflush 为 False 的话，session 进行查询之前不会把当前累计的修改发送到数据库，而直接发送查询语句，所以下面这个查询是查不到对象的。

>>> session3.add(User(name='haha'))
>>> session3.query(User).filter_by(name='haha').first()  # None

再重复的总结一下：

session.flush 的意义：session 计算自己积累的变更，将变更对应的 SQL 语句发送给数据库。 autoflush 的意义：session 在进行查询之前，自动的进行一次 flush 操作。

autocommit 参数

commit 对应的概念是事务（transaction），默认情况下，session 参数 autocommit 的值是 False，SQLAlchemy 也推荐将它设置为 False。

注：MySQL client 默认是将 autocommit 设为 True 的，所以我们在 cli 中执行一条 SQL 语句，数据库的数据就会发生变化

这里复习一下一个基础知识点：在一个事务被提交之前，事务里面的修改只对当前事务可见，其它事务看不见。什么意思？我们看个例子

# ps: session1 的 autocommit 参数为 False, autoflush 参数为 True
# 当 session1 执行 add 操作时，
>>> session1.add(User(name='miao'))

# session1 中是可以查到这个 user 的
>>> session1.query(User).filter_by(name='miao').first()
<__main__.User object at 0x1108f00000>

# session3 中查不到
>>> session3.query(User).filter_by(name='miao').first()  # None

# 让 session1 提交一下当前的事务
>>> session1.commit()

# 再从 session3 中查
>>> session3.query(User).filter_by(name='miao').first() is not None
True

事务不仅可以提交，还可以 rollback，这里就不讲。

SQLAlchemy MySQL 调试小技巧

为 MySQL 打开查询 log

SET GLOBAL log_output = "FILE"; the default.
SET GLOBAL general_log_file = "/path/to/your/mysql.log";
SET GLOBAL general_log = 'ON';

然后在 shell 中 tail -f mysql.log，这样一来，当 MySQL 收到请求时，你就能看到一条日志，这样可以方便你判断 session 执行什么操作时，会发送 SQL 语句，什么时候建立连接。

日志示例：

2018-11-08T15:12:41.332513Z    53 Query commit
2018-11-08T15:12:41.333753Z    53 Query rollback
2018-11-08T15:12:45.999996Z    43 Query select * from user

将上面的脚本导入 python 或者 ipython

python -i test.py

posted @ 2024-03-28 21:12 奋斗终生 Views(311) Comments(0) Edit 收藏举报

刷新页面返回顶部

奋斗终生