让Django支持数据库长连接(可以提高不少性能哦)
书接上回
上回我们说到:《在生产系统使用Tornado WebServer来代替FastCGI加速你的Django应用》
那么现在很流行用一些高性能的nonblock的app server来host Django的应用,这些Server可以看做是一个单进程单线程的程序,然后用nginx在前端反向代理并且负载均衡到N多个后端工作进城来充分利用多CPU的性能,当然这部分的配置工作在上回已经说得很清楚了。但是对于Django来说有一个问题。因为Django的数据库连接是在查询的时候实时创建的,用完就会关掉,这样就会频繁的开闭连接。但是对于Tornado这种Server来说这种方式是低效的。这种Server最高效的工作模式是每个进程开启一个连接,并长期保持不关闭。本文的目的就是尝试使Django改变一贯的作风,采用这种高效的工作模式。本文基于Django1.3的版本,如果是低版本可以稍加更改一样可以使用。
Django的数据库可以通过配置使用专门定制的Backend,我们就从这里入手。
首先我们看看Django自带的Backend是如何实现的。在Django官网上可以看到自带MySql的Package结构,可以点击 此处 前往瞻仰。
通观源码我们可以发现,Django基本上是封装了MySQLdb的Connection和Cursor这两个对象。而且重头实现整个Backend既不实际而且也不能从根本上解决问题。所以我们可以换一个思路。所有的数据库操作都是从获取Connection对象开始的,而获取Connection对象只有一个入口,就是MySQLdb.connect这个函数。所以我们只需要包装MySQLdb这个模块,用我们自己的connect方法替代原本的,这样就从根源上解决了问题。我们在包装器内部维护MySQLdb的Connection对象,使其保持长连接,每次connect被调用的时候判断一下,如果连接存在就返回现有连接,不就完美了吗?所以我们可以分分钟写下第一个解决方案:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
proxies = {} class _DbWrapper(): def __init__( self ,module): self .connection = None #这个就是维护的长连接对象 self .db = module #这个是被包装的原生MySQLdb的module def __getattr__( self , key): return getattr ( self .db, key) #代理所有不关心的函数 def connect( self , * argv, * * kwargv): “”“ 替换原有的connection对象 ”“” if not self .connection: self .connection = self .db.connect( * argv, * * kwargv) return _ConnectionWrapper( self .connection) def manage(module,keepalive = 7 * 3600 ): “”“ 返回代替原生MySQLdb模块的对象 ”“” try : return proxies[module] except KeyError: return proxies.setdefault(module,_DbWrapper(module)) |
把上面代码存到一个叫pool.py的文件里。然后把Django源码里的db/backend/mysql这个package拷贝出来,单独存到我们project目录里一个mysql_pool的目录里。然后修改其中的base.py,在顶上import的部分,找到 import MySQLdb as Database 这句,用下面代码替换之
1
2
3
4
5
6
|
try : import MySQLdb as Database Database = pool.manage(Database) except ImportError, e: from django.core.exceptions import ImproperlyConfigured raise ImproperlyConfigured( "Error loading MySQLdb module: %s" % e) |
这样我们就用自己的模块替换了MySQLdb的,当要connect的时候判断到有连接的时候就不重新创建连接了。
把站点跑起来看,结果如何?刷新几次后报错了。Why?看看日志可以看到如下的错误:
Traceback (most recent call last):
File "/home/www/.virtualenvs/django13/lib/python2.7/site-packages/gevent/wsgi.py", line 114, in handle
result = self.server.application(env, self.start_response)
File "/home/www/.virtualenvs/django13/lib/python2.7/site-packages/django/core/handlers/wsgi.py", line 275, in __call__
signals.request_finished.send(sender=self.__class__)
File "/home/www/.virtualenvs/django13/lib/python2.7/site-packages/django/dispatch/dispatcher.py", line 172, in send
response = receiver(signal=self, sender=sender, **named)
File "/home/www/.virtualenvs/django13/lib/python2.7/site-packages/django/db/__init__.py", line 85, in close_connection
conn.close()
File "/home/www/.virtualenvs/django13/lib/python2.7/site-packages/django/db/backends/__init__.py", line 244, in close
self.connection.close()
看来我们光是包装了MySQLdb本身还不行,在connect后Django获取了Connection的对象,之后就能为所欲为,他用完后很自觉的关掉了,因为他直觉的以为每次connect都拿到了新的Connection对象。所以我们必须把Connection对象也包装了了。所以升级后的解决方案代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
|
proxies = {} class _ConnectionWrapper( object ): """ 用来包装Connection的类 """ def __init__( self ,conn): self .conn = conn def close( self ): """ 屏蔽掉关闭连接的行为 """ pass def __getattr__( self ,key): """ 把其他属性都原封不动的代理出去 """ return getattr ( self .conn, key) class _DbWrapper(): """ 代理MySQLdb模块的对象 """ def __init__( self ,module): self .connection = None #HOLD住的长连接 self .db = module #原始的MySQLdb模块 def __getattr__( self , key): """ 代理除connect外的所有属性 """ return getattr ( self .db, key) def connect( self , * argv, * * kwargv): if not self .connection: self .connection = self .db.connect( * argv, * * kwargv) return _ConnectionWrapper( self .connection) def manage(module): try : return proxies[module] except KeyError: return proxies.setdefault(module,_DbWrapper(module)) |
我们增加了一个_ConnectionWrapper类来代理Connection对象,然后屏蔽掉close函数。把站点跑起来后发现不会出现之前的问题了,跑起来也顺畅不少。但是过了几个小时后问题又来了。因为MySQLdb的Connection有个很蛋痛的问题,就是连接闲置8小时后会自己断掉。不过要解决这个问题很简单,我们发现连接如果闲置了快8小时就close掉重新建立一个连接不就行了么?所以最后解决方案的代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
|
import time proxies = {} class _ConnectionWrapper( object ): def __init__( self ,conn): self .conn = conn def close( self ): pass def __getattr__( self ,key): return getattr ( self .conn, key) class _DbWrapper(): def __init__( self ,module,max_idle): self .connection = None self .db = module self .max_idle = max_idle self .connected = 0 def __getattr__( self , key): return getattr ( self .db, key) def connect( self , * argv, * * kwargv): if not self .connection or time.time() - self .connected> = self .max_idle: try : if self .connection: self .connection.close() except : pass self .connection = self .db.connect( * argv, * * kwargv) self .connected = time.time() return _ConnectionWrapper( self .connection) def manage(module,keepalive = 7 * 3600 ): try : return proxies[module] except KeyError: return proxies.setdefault(module,_DbWrapper(module,keepalive)) |
就此问题解决,世界终于清净了
posted on 2018-07-26 19:46 ExplorerMan 阅读(496) 评论(0) 编辑 收藏 举报
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步