(17)字符编码

* 编码概述
  python2默认编码是ascii
 
 
* 中文处理
    >>> name ="中国"
    >>> name
    Out[265]: '\xe4\xb8\xad\xe5\x9b\xbd' 
    看到一些读不懂的代码
   
    文件开头加上
    # -*- coding: utf-8 -*-
    或
    # coding:utf-8
   
    遇到字符串
    unicode_str = unicode('中文', encoding='utf-8')
    print unicode_str.encode('utf-8')
   
    遇到文件操作
    import codecs
    codecs.open('filename', encoding='utf8')
   
    sys.getdefaultencoding() 得到python解析器的编码
   
    改为解析器的编码:
   
    写在程序入口:
    import sys
    reload(sys)
    sys.setdefaultencoding('utf8')
   
    另一个方案是在python的Lib\site-packages文件夹下新建一个sitecustomize.py,内容为: Python代码

    # encoding=utf8

    import sys  
    reload(sys)
    sys.setdefaultencoding('utf8') 

posted @ 2016-03-03 17:52  toby2chen  阅读(220)  评论(0编辑  收藏  举报