python--编码问题

1、ASCii 占用一个字节,只支持英文

2、GB2312 占用2个字节,支持6700+ 汉字

3、GBK 升级版的2312   支持21000+汉字

4、unicode 2-4字节,

(1)、支持全球所有语言,编码统一

(2)、包含和全球所有各自的编码的映射关系

 

本地使用使用unicode没问题,因为本地计算机内存大,不care。但存储和网络传输时数据一多,占用多了一倍就有问题了

为了解决这个问题,UTF就诞生了,既对unicode的转换

utf-8 可变长编码,使用1-4个字符,英文是1个字符,欧洲2个字节,中文3个字节,其余特殊的就是4个字节

 

posted @ 2019-01-06 03:41  MarkaiElsa  阅读(108)  评论(0编辑  收藏  举报