python3 默认的编码是unicode,加载在内存中的数据就是用的Unicode,保存在硬盘和网络传输的时候用的是utf-8或者GBK

由unicode转换成别的格式需要使用encode(a)函数编码,a为转换后的目标格式,比如转成UTF-8,str.encode('UTF-8')

相反,解码需要decode(a)函数,a为转换前的目标格式,比如由UTF-8解码成unicode:b.decode('UTF-8')

需要注意的是,字符串在Unicode格式时作为字符集,编码之后变成了bytes形式,比如b'\xe4\xb8\xad',这是一个汉字的UTF-8的bytes表现形式