python基础六之编码

  python中编码的特点:

    1,各个编码之间的二进制是不能互相识别的,会产生乱码

    2,文件的储存和传输是不能用Unicode的

python3的编码

  在python3中字符串在内存中是用Unicode编码的,而要完成储存和传输则要将str转换为bytes类型。bytes的操作方式和str相同,但是它的编码和str不同,可以是utf-8,gbk,gb2312等等。

  str →  bytes的方法是str.encode(编码方式)

# encode() 表现形式是将str转变为bytes 编码方式是将Unicode转换为utf-8,gbk,gb2312等等
# 英文,数字和特殊字符转换为bytes后前面加了个b
s = 'zxc'
print(s.encode('utf-8'))  # b'zxc'

# 中文
s = '蔠缬草'
print(s.encode('utf-8'))  # b'\xe8\x94\xa0\xe7\xbc\xac\xe8\x8d\x89'

 

  bytes  → str的方法是bytes.decode()

# decode 解码
s = ''
b = s.encode('utf-8')  # 编码
print(b)
print(b.decode('utf-8'))  # 解码

 

  

posted @ 2017-12-21 13:20  蔠缬艸  阅读(135)  评论(0编辑  收藏  举报