编码与解码
1.编码:
计算机数据都是以二进制进行处理的:0100011011100111100111,只有0跟1
计算机初始的密码本为:ASCII码只用于美国的英文加各种符号,刚开始是7位的,后面由于作者想着会有发展就再加了一位,现在为每个英文跟符号为8位,一个字节
万国码Unicode: 包含全世界所有的文字与二进制0101001的对应关系,支持中文,每个汉字或符号为4个字节,英文4个字节
UTF-8 万国码升级升级版:包含全世界所有的文字与二进制0101001的对应关系(最少用8位一个字节表示一个字符),英文一个字节,中文3个字节
GKB国标码: 中国制造 只限在国内使用,包含英文,数字,中文,中文跟英文都是2个字节
单位之间的换算:
8bit(位) = 1byte(字节)
1024byte(字节) = 1KB
1024KB = 1MB
1024MB = 1GB
1024GB = 1TB
2.编码
s = "来来来" b = s.encode('utf-8') # 将字符串以utf-8的编码方式编码成二进制 c = b.decode('unicode') #将二进制以utf-8进行解码 #用什么编码就用什么解码,不然会乱码 print(c)