编码进阶
s1 = 'taibai' s2 = b'taibai' print(s1,type(s1)) print(s2,type(s2))
s3 = '太白金星' s4 = '太白金星'.encode('utf-8') print(s3, type(s3)) print(s4, type(s4))
bytes类型和str是孪生兄弟,str有的功能,bytes也都有
实例:
s1 = b'alex'
print(s1.capitalize())
# str ---> bytes 编码 encode()
s1 = 'alex' b1 = s1.encode('utf-8') # 编码 b2 = s1.encode('gbk') print(s1, type(s1)) print(b1, type(b1)) print(b2, type(b2))
中文形式的
s1 = '太白' b1 = s1.encode('utf-8') b2 = s1.encode('gbk') print(s1,b1) print(s1,b2)
bytes ---> str decode()解码
b1 = b'\xe5\xa4\xaa\xe7\x99\xbd' s1 = b1.decode('utf-8') print(s1)
#必须使用utf-8,如果使用gbk就报错了。
b1 = b'\xe5\xa4\xaa\xe7\x99\xbd' s1 = b1.decode('gbk') print(s1)
作者:wangkaiok —— 小菜鸟111
出处:http://www.cnblogs.com/wangkaiok/
本文版权归作者和博客园共有,但未经作者同意禁止转载,转载必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。