python3————文本和二进制的区分

python默认字符是uncode

python3最重要的特性是对文本和二进制数据做了清晰的区分。

文本总是Unicode,str类型表示,二进制数据则由bytes类型表示,python3不会以任意隐蔽的分时混用str和bytes。

但是两者可以互相转换。

实例:1

>>>'$20'.encode('utf-8')

b'\xe2\x82\xac20'

>>>b'\xe2\x82\xac20'.decode('utf-8')

'$20'

实例:2

msg = '我爱北京天安门'

print (msg)

print (msg.encode(encoding='"utf-8"))

print(msg.encode(encoding="utf-8").decode(encoding="uft-8"))

 

更换字符格式是用enconde,转换str和bytes是用decode

 

如下

 

gbk是向下兼容的,所以可以转换bg2312

 

posted @ 2018-03-19 18:51  小公子ww  阅读(252)  评论(0编辑  收藏  举报