关于字符编码集

支持中文的第一张表就叫GB2312

1980 GB2312 6700+

1995 GBK1.0 20000+

2000 GB18030 27000+

unicode 万国码支持所有国家和地区的编码

2^16=65535 存一个字符统一占用2字节

UTF-8=unicode的扩展集，可变长的字符编码集

UTF-8是对Unicode的压缩和分类，也不再使用最少2个字节，而是将所有的字符和符号进行分类：ASSIC码中的内容用1个字节保存，欧洲的字符用2个字节保存，东亚的字符用3个字节保存。

关于python支持的编码集

python2.x 默认支持ASSIC码

想要支持中文必须在程序开头申明 # -*- coding:utf-8 -*-或者#coding:utf-8

python3.x 默认支持unicode

posted on 2018-01-26 14:34 行走的cd 阅读(128) 评论(0) 收藏举报