讲的比较明白的博客:http://www.cnblogs.com/huxi/archive/2010/12/05/1897271.html

以上面博文的汉为例子,汉字的GBK编码是baba, UNICODE码字是6C49 UTF16-LE编码是496C,UTF-8编码是e6b189

python文件的编码制定为GBK

   line="汉"

  input=line.decode('gbk','ignore').encode("UTF-8"); 

  rint repr(input)

 

以上三行代码输出正确,但是当编码变为UTF-16LE的时候,就不行了。 这时需要用print binascii.hexlify(input)

 

posted on 2015-09-29 10:49  finallyly  阅读(221)  评论(0编辑  收藏  举报