Python--编码的疑惑

XML语法分析器在处理的时候,使用的是Unicode字符串,并且将其返回。Unicode可以处理特殊字符,但是如果将Unicode字符串转换为普通字符串,就会引发异常,比如Print,

>>some_string= u'Mooaw'

>>some_string ==>UnicodeError

 

 如果字符串中包含特殊字符的话,可以使用sys.getdefaultencoding函数查看程序的默认编码方式

还可以使用sys.setdefaultencoding进行更改,但是只能在叫做site.py的site-wide自定义文件中进行。

编码可以使用encode方法完成:

somw_string.encode('iso8895-1')  ==>latin-1

具体的输出由终端模拟器决定

如果你在源代码中直接使用非ASCII字符,你需要标出,以告知解释器如何处理文件。 在Pund bang行的后面:

#-*-coding:latin-1-*-

posted @ 2016-07-27 08:52  AhMay  阅读(222)  评论(0编辑  收藏  举报