(17)字符编码
* 编码概述
python2默认编码是ascii
* 中文处理
>>> name ="中国"
>>> name
Out[265]: '\xe4\xb8\xad\xe5\x9b\xbd'
看到一些读不懂的代码
文件开头加上
# -*- coding: utf-8 -*-
或
# coding:utf-8
遇到字符串
unicode_str = unicode('中文', encoding='utf-8')
print unicode_str.encode('utf-8')
遇到文件操作
import codecs
codecs.open('filename', encoding='utf8')
sys.getdefaultencoding() 得到python解析器的编码
改为解析器的编码:
写在程序入口:
import sys
reload(sys)
sys.setdefaultencoding('utf8')
另一个方案是在python的Lib\site-packages文件夹下新建一个sitecustomize.py,内容为: Python代码
# encoding=utf8
import sys
reload(sys)
sys.setdefaultencoding('utf8')
作者:陈伟明 |
联系 : QQ 942923305 | 微信 toby942923305 |
E-mail: toby2chen@hotmail.com