1. python2的编码:
python2中使用的是ASCII码,所以不支持中文,如果要在python2中写入中文编码,需要在文件头编写:
#-*- encoding:utf-8 -*-
2. 不同编码介绍
1,ASCII:最早的编码,里面有英文大写字母,小写字母,数字,一些特殊字符,没有中文。8个bit,1个byte。
2,GBK:中文国标码,里面包含了ASCII编码,16个bit,2个byte。
3,unicode:万国码,里面包含了全世界所有国家的文字编码,32个bit,4个byte,包含了ASCII。
4,UTF-8:可变长度的万国码,是unicode的一种实现,最小字符占8位
英文:8bit 1byte
欧洲文字:16bit 2byte
中文:24bit 3byte