SQlALchemy session详解
系列文章:
概念
session用于创建程序和数据库之间的会话,所有对象的载入和保存都需通过session对象 。
通过sessionmaker调用创建一个工厂,并关联Engine以确保每个session都可以使用该Engine连接资源:
from sqlalchemy.orm import sessionmaker
# 创建session
DbSession = sessionmaker(bind=engine)
session = DbSession()
操作
session的常见操作方法包括:
- flush:预提交,提交到数据库文件,还未写入数据库文件中
- commit:提交了一个事务,把内存的数据直接写入数据库
- rollback:回滚
- close:关闭
在事务处理时,需注意一下两点:
- 在事务处理过程发生异常时,进行rollback操作,否则会在下次操作时报错:
Can’t reconnect until invalid transaction is rolled back
- 一般情况下,在一个事务处理完成之后要关闭session,以确保数据操作的准确性。
建议封装上下文方法:
from contextlib import contextmanager
@contextmanager
def session_maker(session=session):
try:
yield session
session.commit()
except:
session.rollback()
raise
finally:
session.close()
调用:
def update_user():
with session_maker() as db_session:
db_session.query(Users).filter_by(name='test2').update({'email': 'test2@qq.com'})
线程安全
session不是线程安全的,并且我们一般session对象都是全局的,那么在多线程情况下,当多个线程共享一个session时,数据处理就会发生错误。
为了保证线程安全,需使用scoped_session方法:
db_session = scoped_session(sessionmaker(bind=engine))
内部原理
session对象包含了三个重要的部分:
- 标识映射(Identity Map)
- 对象的状态 / 状态跟踪
- 事务
标识映射
标识映射是与ORM关联的集合,通过标识映射保证了数据库操作的准确性。
具体的实现原理是:维护一个Python字典(IdentityMap),关联这个Session对象到数据库ID的映射,当应用程序想要获取一个session对象时,若该对象不存在,标识映射会加载该对象并缓存,若该对象已存在,则直接获取。这样的好处是:
- 已经被请求过的session对象缓存下来,不需要连接加载多次,造成额外的开销;
- 避免了数据不一致
状态跟踪
一个Session对象从创建到销毁,依次经历四种状态,分别是:
- Transient:刚new出来的对象,还不在会话中,也没有保存到数据库。
- Pending:transient的对象调用add后,就会变成pending状态,这时会加入sqlalchemy的监管范围,数据并未更新到数据库。
- Persistent:该状态表明数据库里已经记录了该对象,在两种情况下对象处于该状态:一是通过flush()方法刷新pending对象,二是从数据库query()得到对象。
- Detached:在会话中的事务提交之后,所有的对象都将是Detached状态。
所谓的状态跟踪,就是跟踪以上四个状态,保证数据的准确性并在合理的时机丢弃对象以保证合理开销,那么具体是怎么实现的呢?
我们可以看到,只有在pending状态时,对象的内存数据和数据库中的数据不一致,在Persistent状态时,内存数据和数据库数据已经一致,那么此后任意时刻丢弃该对象数据都是可以的,这时就需要找个合适的时机丢弃对象,过早或过晚都有其缺陷。于是,就让垃圾回收器来做决定,在内存不够的时候释放对象,回收内存。
Session对象采用了弱引用机制,所谓弱引用,就是说,在保存了对象的引用的情况下,对象仍然可能被垃圾回收器回收。在某一时刻通过引用访问对象时,对象可能存在也可能不存在,如果对象不存在,就重新从数据库中加载对象。而如果不希望对象被回收,只需要另外保存一个对象的强引用即可 。
session对象包括三个属性:
- new:刚加入会话的对象
- dirty:刚被修改的对象
- deleted:在会话中被删除的对象
三个属性共同的特点就是内存的数据和数据库数据不一致,也就是对象处于pending状态,这也就表明了session保存了所有对象处于pending状态的强引用。
以上。
代码可参照:my github