Python+SQLAlchemy+MySQLdb+MySQL的中文乱码及其解决办法
先说结论:
两种办法:
self.engine=create_engine("mysql://user:pass@localhost/test",connect_args={'charset':'utf8'}) workaround 1, take effect
self.engine=create_engine("mysql://user:pass@localhost/test?charset=utf8") #workaround 2, take effect
python: 2.7.2
SQLAlchemy:0.7.2
MySQLdb: 1.2.3
MySQL: 5.1.58
python源文件: # –*- encoding:utf8 –*-
MySQL 都是utf8
create_engine(‘mysql://user:pass@localhost/test’,encoding=’utf8’,echo=True)
如果插入’李小龙’,则python插入数据库的中文字符在mysql client和phpmyadmin中看都是乱码。
如果插入u’李小龙’,那么则报Exception:
UnicodeEncodeError: 'latin-1' codec can't encode characters in position 0-2: ordinal not in range(256)
经过逐步跟踪debug,发现最终问题出在系统中的这个函数上:
sqlalchemy\connectors\mysqldb.py
def create_connect_args(self, url):
。。。。
return [[], opts]
最后一句返回的要传递给MySQLdb的第一部分变量始终是[],而encoding的信息应该存放在这里的,所以即使在程序中设置了encoding=’utf8’也无济于事。
经过分析代码,发现有两种方法可以在不修改库代码的情况下,解决这个问题。
self.engine=create_engine("mysql://root:pass@localhost/test",connect_args={'charset':'utf8'},echo=True) workaround 1, take effect 参见“cparams.update(kwargs.pop('connect_args', {}))”
self.engine=create_engine("mysql://root:pass@localhost/test?charset=utf8",echo=True) #workaround 2, take effect 参见“ opts.update(url.query)”
sqlalchemy\engine\strategies.py
class DefaultEngineStrategy(EngineStrategy):
"""Base class for built-in stratgies."""
def create(self, name_or_url, **kwargs):
…
cparams.update(kwargs.pop('connect_args', {}))
…
sqlalchemy\connectors\mysqldb.py
def create_connect_args(self, url)
…
opts.update(url.query)
…