Python--编码的疑惑
XML语法分析器在处理的时候,使用的是Unicode字符串,并且将其返回。Unicode可以处理特殊字符,但是如果将Unicode字符串转换为普通字符串,就会引发异常,比如Print,
>>some_string= u'Mooaw'
>>some_string ==>UnicodeError
如果字符串中包含特殊字符的话,可以使用sys.getdefaultencoding函数查看程序的默认编码方式
还可以使用sys.setdefaultencoding进行更改,但是只能在叫做site.py的site-wide自定义文件中进行。
编码可以使用encode方法完成:
somw_string.encode('iso8895-1') ==>latin-1
具体的输出由终端模拟器决定
如果你在源代码中直接使用非ASCII字符,你需要标出,以告知解释器如何处理文件。 在Pund bang行的后面:
#-*-coding:latin-1-*-