python字符编码与转码
转码流程图
GBK需要转换为UTF-8格式流程:
1.首先通过解码【decode】转换为Unicode编码
2.然后通过编码【encode】转换为UTF-8的编码
UTF-8需要转换为GBK格式流程:
1.首先通过解码【decode】转换为Unicode编码
2.然后通过编码【encode】转换为GBK的编码
''' function: 字符编码与转码 aythor:yaozhian datetime:2019.07.04 description: 在python2中默认的编码是ASCII,python3中默认的编码是utf-8 python2中,str就是编码后的结果bytes,str=bytes,所以str只能decode python3中字符串与python2中的u'字符串',都是unicode,只能encode ''' import sys print(sys.getdefaultencoding()) # 输出 utf-8 # python3字符串默认编码unicode str1 = "衣服大小尺寸合适" print(type(str1)) # 可将unicode转换为utf-8编码 str2 = str1.encode('utf-8') print(type(str2)) # 可将utf-8转换为unicode编码 str3 = str2.decode() print(type(str3))