day6-1

字符编码与解码:

Unicode  默认都占两个字符,用ASCII码英文占一个字节,ASCII码不能存中文

Unicode 存放英文会浪费空间

utf-8 存放时因为是一个字节,中文三个字节

 

unicode  -------->通过编码 encode  转换为其他编码

其他编码   ————>  解码decode  为  unicode

 1 a = "时间煮雨"
 2 print(a)
 3 print(a.encode("utf-8"))
 4 print(a.encode("utf-8").decode("utf-8"))
 5 print(a.encode("utf-8").decode("utf-8").encode("gbk"))
 6 print(a.encode("utf-8").decode("utf-8").encode("gbk").decode("gbk"))
 7 
 8 
 9 '''
10 时间煮雨
11 b'\xe6\x97\xb6\xe9\x97\xb4\xe7\x85\xae\xe9\x9b\xa8'
12 时间煮雨
13 b'\xca\xb1\xbc\xe4\xd6\xf3\xd3\xea'
14 时间煮雨
15 '''
View Code

python 3中系统默认编码是Unicode,并且使用encode编码后会变成 bytes类型,python3文件编码是utf-8 但python 3 中信息是unicode编码

可以通过-*- coding:gbk -*- 修改文件编码

 

posted @ 2018-09-27 21:57  杨fj  阅读(94)  评论(0编辑  收藏  举报