编码与解码

1.编码:

计算机数据都是以二进制进行处理的:0100011011100111100111,只有0跟1

计算机初始的密码本为:ASCII码只用于美国的英文加各种符号,刚开始是7位的,后面由于作者想着会有发展就再加了一位,现在为每个英文跟符号为8位,一个字节

万国码Unicode: 包含全世界所有的文字与二进制0101001的对应关系,支持中文,每个汉字或符号为4个字节,英文4个字节

UTF-8 万国码升级升级版:包含全世界所有的文字与二进制0101001的对应关系(最少用8位一个字节表示一个字符),英文一个字节,中文3个字节

GKB国标码: 中国制造 只限在国内使用,包含英文,数字,中文,中文跟英文都是2个字节

单位之间的换算

8bit(位) = 1byte(字节)
1024byte(字节) = 1KB
1024KB = 1MB
1024MB = 1GB
1024GB = 1TB

2.编码
s = "来来来"  
b = s.encode('utf-8')  # 将字符串以utf-8的编码方式编码成二进制
c = b.decode('unicode') #将二进制以utf-8进行解码
#用什么编码就用什么解码,不然会乱码
print(c)

 

 
posted @ 2019-07-09 18:15  tiwe  阅读(177)  评论(0编辑  收藏  举报