7.9 day6

1. is 和 == 区别
id()函数
== 判断两边的值
is 判断内存地址
回顾编码:
1. ASCII: 英文, 特殊字符, 数字, 8bit, 1byte
2. GBK: 中文 16bit, 2byte. 兼容ASCII
3. unicode: 万国码, 32bit 4byte. 兼容ASCII
4. UTF-8: 长度可变的unicode. 英文:8bit, 欧洲:16bit, 中文:24bit 3byte

python2 只能用ASCII
python3 有unicode, 默认的编码就是unicode
内存里用的是unicode. 硬盘和网络传输用的是utf-8或者GBK

2. encode() 编码. 获取到的是编码之后的结果. 把字符串转换成bytes

s = 'arios'

s.encode('UTF-8') 

s.encode('unicode') # 英文编码还是英文

s = '翻车鱼'

s.encode('UTF-8) # 中文编码是根据编码类型转换成几位bytes

 

3. decode() 解码. 把bytes编程我们熟悉的字符串

把bytes类型的数据转换回字符串

.decode('UTF-8')

posted @ 2018-07-09 18:38  smdfcy  阅读(103)  评论(0编辑  收藏  举报