Python中文支持小结

  • 源码文件保存的时候,需要用UTF-8编码
  • 文件头添加编码标记:
    # coding=UTF-8

  • UTF-8和其他格式编码的互换,可以使用 decode 和 encode 函数
    encode是将UTF-8字符串转变为其他编码的串,decode是将其他编码串转换为UTF-8串
    例如,text 是一个包含 GB2312 编码内容的字符串,可以用下述代码将其转换为 UTF-8 编码:
    text.decode(“GB2312”)

  • 使用正则表达式时,记得用上  re.UNICODE 选项

posted on 2011-05-16 20:31  夏日微风  阅读(313)  评论(0编辑  收藏  举报

导航