Flask-SqlAchemy源码之session详解解决连接gone away问题


  • 线上连接gone away问题

我们业务中需要执行一个时间超过8小时的脚本,然后发生了连接gone away的问题,然后开始找原因,首先我们的伪代码如下:

app = create_app()
def prod_script():
    with app.app_context():
        machine_objs = DiggerMapper.get_all()
        time.sleep(8*3600)   # 替代线上执行比较久的代码
        machine_objs = DiggerMapper.get_all()   # 再执行这次数据库查询时发生连接gone away的报错
    return True

通过排查原因基本定位为,在执行代码的时候本次连接时间比较久,超过了mysql的默认最长空闲连接时间8小时就被断开了,所以再次进行数据库查询时就报错连接gone away。

  • 解决方案

ok,知道了错误发生的原因,我们的基本思路就是,给每次查询结束以后我们就把数据库连接放回连接池中,然后下次要使用时再次从连接池中取连接就好了。代码如下:

app = create_app()
def prod_script():
    with app.app_context():
        machine_objs = DiggerMapper.get_all()
        db.session.close()
        time.sleep(8*3600)   # 替代线上执行比较久的代码
        machine_objs = DiggerMapper.get_all()  
    return True

那么这样就解决问题了吗?我们知道mysql在空闲连接超过8小时后会主动断开连接,所以连接池中的空闲连接在超过8小时后也是会被mysql断开的,那么下次进行数据库操作时依然会继续报错,我们还需要加上一条设置放在config文件中的SQLALCHEMY_POOL_RECYCLE = 3600 这条设置的意思是让连接池每隔一小时重新和mysql建立连接,这样我们取到连接都是可用连接了。

通过以上两步就基本上可以解决连接gone away问题了。

那么都到这一步了, 知其然要知其所以然,都是这个session在进行操作,那么这个session是怎么工作的呢?我们去找找它的源码。

  • session源码

我们在创建app前通常会先实例化SQLAlchemy,然后执行init_app(app),那么找session我们先看它实例化的代码做了什么工作:

db = SQLAlchemy()

def create_app():
   app = Flask(__name__)
   db.init_app(app)
   return app


class SQLAlchemy(object):
    
    def __init__(self, app=None, use_native_unicode=True, session_options=None,
                 metadata=None, query_class=BaseQuery, model_class=Model,
                 engine_options=None):

        self.use_native_unicode = use_native_unicode
        self.Query = query_class
        self.session = self.create_scoped_session(session_options)
        self.Model = self.make_declarative_base(model_class, metadata)
        self._engine_lock = Lock()
        self.app = app
        self._engine_options = engine_options or {}
        _include_sqlalchemy(self, query_class)

        if app is not None:
            self.init_app(app)

我们看到session是create_scoped_session(session_options)生成的,然后进入这个方法看到:

    def create_scoped_session(self, options=None):

        if options is None:
            options = {}

        scopefunc = options.pop('scopefunc', _app_ctx_stack.__ident_func__)
        options.setdefault('query_cls', self.Query)
        return orm.scoped_session(
            self.create_session(options), scopefunc=scopefunc
        )

上面看到相当于session是由 orm.scoped_session方法生成的,其中self.create_session(options)方法在被调用时默认生成一个SignallingSession对象,我们再看看orm.scoped_session方法发生了什么:

class scoped_session(object):
    def __init__(self, session_factory, scopefunc=None):

        self.session_factory = session_factory

        if scopefunc:
            self.registry = ScopedRegistry(session_factory, scopefunc)
        else:
            self.registry = ThreadLocalRegistry(session_factory)

 # self.registry 类似如下
 self.registry = {"线程id": SignallingSession, "线程id2": SignallingSession}

好吧,scoped_session是一个类,实例化以后有个属性self.registry,如果之前有看过flask源码知道像请求上下文和应用上下文一样,它是一个基于线程安全的字典,每一个线程有自己的session类。

这是你可能有个疑问既然这里返回的是一个scoped_session对象,但是类中并没有query等方法那么db.session.query(), db.session.close()这些是怎么来的,答案就是在文件下还有一段立即执行的代码如下:

ScopedSession = scoped_session
"""Old name for backwards compatibility."""


def instrument(name):
    def do(self, *args, **kwargs):
        return getattr(self.registry(), name)(*args, **kwargs)

    return do


for meth in Session.public_methods:
    setattr(scoped_session, meth, instrument(meth))

这段代码的意思就是把SqlAchemy的Session类中有的所有方法,也给上面我们提到默认SignallingSession对象加上,这样我们就可以调用query等方法了。并且也相当于每次执行数据库操作时都会创建或者共用之前创建的session连接,

然后我们在代码中从来没有主动关闭连接的代码,flask-sqlachemy是怎么帮我们关闭连接的呢?答案是它里面在请求完成后主动帮我们关闭了,在init_app的代码中有如下代码:

    def init_app(self, app):
        """This callback can be used to initialize an application for the
        use with this database setup.  Never use a database in the context
        of an application not initialized that way or connections will
        leak.
        """
        if (
            'SQLALCHEMY_DATABASE_URI' not in app.config and
            'SQLALCHEMY_BINDS' not in app.config
        ):
            warnings.warn(
                'Neither SQLALCHEMY_DATABASE_URI nor SQLALCHEMY_BINDS is set. '
                'Defaulting SQLALCHEMY_DATABASE_URI to "sqlite:///:memory:".'
            )

        app.config.setdefault('SQLALCHEMY_DATABASE_URI', 'sqlite:///:memory:')
        app.config.setdefault('SQLALCHEMY_BINDS', None)
        app.config.setdefault('SQLALCHEMY_NATIVE_UNICODE', None)
        app.config.setdefault('SQLALCHEMY_ECHO', False)
        app.config.setdefault('SQLALCHEMY_RECORD_QUERIES', None)
        app.config.setdefault('SQLALCHEMY_POOL_SIZE', None)
        app.config.setdefault('SQLALCHEMY_POOL_TIMEOUT', None)
        app.config.setdefault('SQLALCHEMY_POOL_RECYCLE', None)
        app.config.setdefault('SQLALCHEMY_MAX_OVERFLOW', None)
        app.config.setdefault('SQLALCHEMY_COMMIT_ON_TEARDOWN', False)
        track_modifications = app.config.setdefault(
            'SQLALCHEMY_TRACK_MODIFICATIONS', None
        )
        app.config.setdefault('SQLALCHEMY_ENGINE_OPTIONS', {})

        if track_modifications is None:
            warnings.warn(FSADeprecationWarning(
                'SQLALCHEMY_TRACK_MODIFICATIONS adds significant overhead and '
                'will be disabled by default in the future.  Set it to True '
                'or False to suppress this warning.'
            ))

        # Deprecation warnings for config keys that should be replaced by SQLALCHEMY_ENGINE_OPTIONS.
        utils.engine_config_warning(app.config, '3.0', 'SQLALCHEMY_POOL_SIZE', 'pool_size')
        utils.engine_config_warning(app.config, '3.0', 'SQLALCHEMY_POOL_TIMEOUT', 'pool_timeout')
        utils.engine_config_warning(app.config, '3.0', 'SQLALCHEMY_POOL_RECYCLE', 'pool_recycle')
        utils.engine_config_warning(app.config, '3.0', 'SQLALCHEMY_MAX_OVERFLOW', 'max_overflow')

        app.extensions['sqlalchemy'] = _SQLAlchemyState(self)

        @app.teardown_appcontext
        def shutdown_session(response_or_exc):
            if app.config['SQLALCHEMY_COMMIT_ON_TEARDOWN']:
                warnings.warn(
                    "'COMMIT_ON_TEARDOWN' is deprecated and will be"
                    " removed in version 3.1. Call"
                    " 'db.session.commit()'` directly instead.",
                    DeprecationWarning,
                )

                if response_or_exc is None:
                    self.session.commit()

            self.session.remove()
            return response_or_exc

其中shutdown_session方法就是在请求结束后,主动帮我们关闭session连接放回连接池中。

  • 总结

综上源码所述,解释了

  • 为什么我们可以随时关闭session连接,因为每次数据库操作都可以重新创建连接
  • 为什么设置SQLALCHEMY_POOL_RECYCLE 配置,因为让连接保持活跃不被mysql断开
  • 遇到执行比较久的代码怎么做,在适当的时候我们主动关闭session连接放回连接池中保证连接的可用
posted @ 2021-03-30 21:20  种树飞  阅读(539)  评论(0编辑  收藏  举报