编码进阶

s1 = 'taibai'
s2 = b'taibai'
print(s1,type(s1))
print(s2,type(s2))

s3 = '太白金星'
s4 = '太白金星'.encode('utf-8')
print(s3, type(s3))
print(s4, type(s4))

bytes类型和str是孪生兄弟,str有的功能,bytes也都有

实例:

s1 = b'alex'
print(s1.capitalize())

# str ---> bytes  编码 encode()
s1 = 'alex'
b1 = s1.encode('utf-8')  # 编码
b2 = s1.encode('gbk')
print(s1, type(s1))
print(b1, type(b1))
print(b2, type(b2))

中文形式的

s1 = '太白'
b1 = s1.encode('utf-8')
b2 = s1.encode('gbk')
print(s1,b1)
print(s1,b2)

 

bytes ---> str  decode()解码
b1 = b'\xe5\xa4\xaa\xe7\x99\xbd'
s1 = b1.decode('utf-8')
print(s1)

#必须使用utf-8,如果使用gbk就报错了。

b1 = b'\xe5\xa4\xaa\xe7\x99\xbd'
s1 = b1.decode('gbk')
print(s1)

 

 



posted @ 2018-10-29 11:19  小菜鸟111  阅读(194)  评论(0编辑  收藏  举报