Python学习06

二进制
-->ASCII:只能存英文跟拉丁字符,一个字符占一个字节,8位
--->gb2312:只能6700多个中文,1980
------>gbk1.0:存了2万多个字符,1995
--------->gb18030:2000,27000中文
------------->unicode:utf-32 :一个字符占4个字节
------------->unicode:utf-16 :一个字符占2个字节或2个以上。65535
------------->unicode:utf-8 :一个英文用ASCII编码来存,一个中文占3个字节
编码:encode ---- 解码:decode
in python2
默认:ASCII
#-*- coding:utf-8 _*_
in python3
默认:unicode
encode 在编码的同时,会把数据转成bytes类型
decode 在解码的同时,会把bytes类型转化成字符串
b = byte = 字节类型 = [0-255]
import sys
s ='i am 编码'
print(sys.getdefaultencoding())#文件的默认编码
s_to_gbk = s.encode('gbk')
print(s)
print(s_to_gbk)
print(s_to_gbk.decode('gbk'))

posted on 2019-03-27 07:59  抓虫者  阅读(180)  评论(0编辑  收藏  举报

导航