6、字符编码

第一张支持中文的编码表GB2312(1980年)支持7445个字符,包括6763个汉字和632和其他字符;
GBK1.0(1995年)汉字区包含21003个字符;
GB18030(2000年)包含27484个汉字和其他少数民族文字;
unicode:万国码 支持所有的国家和地区的编码
2**16 = 65535 存一个字符统一占用两个字节
UITF-8 : Unicode的扩展集,可变长的字符编码集
英文一个字节,欧洲的字符使用两个字节保存,东亚的字符三个字节
Assic-->GB2313-->GBK1.0-->GB18030
Assic-->unicode-->utf-8

python2.X 默认使用Assic编码
python3.X 默认使用unicode编码

windowds 改为GBK:chcp 936

posted @ 2019-05-23 23:08  hlc-123  阅读(223)  评论(0编辑  收藏  举报