Python+SQLAlchemy+MySQLdb+MySQL的中文乱码及其解决办法

先说结论:

两种办法:

self.engine=create_engine("mysql://user:pass@localhost/test",connect_args={'charset':'utf8'}) workaround 1, take effect

self.engine=create_engine("mysql://user:pass@localhost/test?charset=utf8") #workaround 2, take effect

 

python: 2.7.2

SQLAlchemy:0.7.2

MySQLdb: 1.2.3

MySQL: 5.1.58

 

python源文件: # –*- encoding:utf8 –*-

MySQL 都是utf8

create_engine(‘mysql://user:pass@localhost/test’,encoding=’utf8’,echo=True)

 

如果插入’李小龙’,则python插入数据库的中文字符在mysql client和phpmyadmin中看都是乱码。

如果插入u’李小龙’,那么则报Exception:

UnicodeEncodeError: 'latin-1' codec can't encode characters in position 0-2: ordinal not in range(256)

 

经过逐步跟踪debug,发现最终问题出在系统中的这个函数上:

 

sqlalchemy\connectors\mysqldb.py

 

def create_connect_args(self, url):
   。。。。

   return [[], opts]

最后一句返回的要传递给MySQLdb的第一部分变量始终是[],而encoding的信息应该存放在这里的,所以即使在程序中设置了encoding=’utf8’也无济于事。

经过分析代码,发现有两种方法可以在不修改库代码的情况下,解决这个问题。

self.engine=create_engine("mysql://root:pass@localhost/test",connect_args={'charset':'utf8'},echo=True) workaround 1, take effect 参见“cparams.update(kwargs.pop('connect_args', {}))”

self.engine=create_engine("mysql://root:pass@localhost/test?charset=utf8",echo=True) #workaround 2, take effect 参见“ opts.update(url.query)”

sqlalchemy\engine\strategies.py


class DefaultEngineStrategy(EngineStrategy):
"""Base class for built-in stratgies."""

def create(self, name_or_url, **kwargs):

cparams.update(kwargs.pop('connect_args', {}))

 

 

sqlalchemy\connectors\mysqldb.py

def create_connect_args(self, url)

    …

    opts.update(url.query)

    …

 

 

posted @ 2011-10-12 00:42  leether  阅读(2508)  评论(0编辑  收藏  举报