支持中文的第一张表就叫GB2312

1980 GB2312  6700+

1995 GBK1.0  20000+

2000 GB18030  27000+

 

unicode 万国码  支持所有国家和地区的编码

2^16=65535  存一个字符统一占用2字节

 

UTF-8=unicode的扩展集,可变长的字符编码集

UTF-8是对Unicode的压缩和分类,也不再使用最少2个字节,而是将所有的字符和符号进行分类:ASSIC码中的内容用1个字节保存,欧洲的字符用2个字节保存,东亚的字符用3个字节保存。

关于python支持的编码集

python2.x 默认支持ASSIC码

想要支持中文必须在程序开头申明   # -*- coding:utf-8 -*-或者#coding:utf-8

python3.x 默认支持unicode

posted on 2018-01-26 14:34  行走的cd  阅读(114)  评论(0编辑  收藏  举报