一、python2的编码
在python2中,默认的字符编码是ASCII,不同字符编码见的转换都要先解码(decode),然后再转码(encode
GBK转为utf -8
s.decode('gbk').encode('utf-8')
utf-8转为gbk
s.decode('utf-8').encode('gbk')
二、python3的编码
在python3里默认字符是Unicode,而文件编码是utf-8
msg = '你好呀!' msg_gbk = msg.encode('gbk') #unicode转为gbk msg_utf8 =msg.encode('utf-8') #unicode转为utf-8 print(msg) print('gbk编码:',msg_gbk) print('utf8编码:',msg_utf8) print('gbk解码:',msg_gbk.decode('gbk')) #gbk转为unicode print('utf8解码:',msg_utf8.decode('utf8')) #utf-8转为unicode --你好呀! --gbk编码: b'\xc4\xe3\xba\xc3\xd1\xbd\xa3\xa1' --utf8编码: b'\xe4\xbd\xa0\xe5\xa5\xbd\xe5\x91\x80\xef\xbc\x81' --gbk解码: 你好呀! --utf8解码: 你好呀!
草根-920