编码转换

编码问题

python2解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill),而python3对内容进行编码的默认为utf-8。

ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,其最多只能用 8 位来表示(一个字节),即:2**8 = 256,所以,ASCII码最多只能表示 256 个符号。


asscii美国 256位没有中文 python2编码方式就是asci
      一个字符八个字节

gbk 中国
    中文 2个字节 16位
    英文 1个字节 8位

unicode 万国码
    英文 2个字节  16位
    中文 4个字节    32位

utf-8 可变编码
    英文 1个字节 8位
    欧洲  2个字节 16位
    亚洲  3个字节  24位

bit 位
bytes 字节

1B == 8bit
1024B = 1kB
1024kB = 1MB
1024MB = 1GB
1024GB = 1TB

 

# windows 系统 cmd 编码是gbk
# linux系统 终端是 utf-8

 

编码
编码的转换
s = 'alex'
s1 = s.encode('utf-8')   # 编码     utf-8  包含了ascii
print(s1.decode('gbk'))  # 解码     gbk    包含了ascii




































posted on 2019-01-06 15:56  🐳️南栀倾寒🐳️  阅读(175)  评论(0编辑  收藏  举报

导航