python3————文本和二进制的区分
python默认字符是uncode
python3最重要的特性是对文本和二进制数据做了清晰的区分。
文本总是Unicode,str类型表示,二进制数据则由bytes类型表示,python3不会以任意隐蔽的分时混用str和bytes。
但是两者可以互相转换。
实例:1
>>>'$20'.encode('utf-8')
b'\xe2\x82\xac20'
>>>b'\xe2\x82\xac20'.decode('utf-8')
'$20'
实例:2
msg = '我爱北京天安门'
print (msg)
print (msg.encode(encoding='"utf-8"))
print(msg.encode(encoding="utf-8").decode(encoding="uft-8"))
更换字符格式是用enconde,转换str和bytes是用decode
如下
gbk是向下兼容的,所以可以转换bg2312
如
滚滚红尘不要着急,出门带一杯枸杞。