一、python2的编码
  在python2中,默认的字符编码是ASCII,不同字符编码见的转换都要先解码(decode),然后再转码(encode

     GBK转为utf -8

        s.decode('gbk').encode('utf-8')

     utf-8转为gbk

        s.decode('utf-8').encode('gbk')

 

二、python3的编码

  在python3里默认字符是Unicode,而文件编码是utf-8

 

 

msg = '你好呀!'
msg_gbk = msg.encode('gbk')                      #unicode转为gbk
msg_utf8 =msg.encode('utf-8')                 #unicode转为utf-8
print(msg)
print('gbk编码:',msg_gbk)
print('utf8编码:',msg_utf8)

print('gbk解码:',msg_gbk.decode('gbk'))          #gbk转为unicode
print('utf8解码:',msg_utf8.decode('utf8'))         #utf-8转为unicode



--你好呀!
--gbk编码: b'\xc4\xe3\xba\xc3\xd1\xbd\xa3\xa1'
--utf8编码: b'\xe4\xbd\xa0\xe5\xa5\xbd\xe5\x91\x80\xef\xbc\x81'
--gbk解码: 你好呀!
--utf8解码: 你好呀!

 

posted on 2022-05-18 16:24  草根920  阅读(206)  评论(0编辑  收藏  举报