讲的比较明白的博客:http://www.cnblogs.com/huxi/archive/2010/12/05/1897271.html
以上面博文的汉为例子,汉字的GBK编码是baba, UNICODE码字是6C49 UTF16-LE编码是496C,UTF-8编码是e6b189
python文件的编码制定为GBK
line="汉"
input=line.decode('gbk','ignore').encode("UTF-8");
rint repr(input)
以上三行代码输出正确,但是当编码变为UTF-16LE的时候,就不行了。 这时需要用print binascii.hexlify(input)