Python 学习之[编码]

全世界最早的编码是ASCII 最早只有 256个bit 8位 但是只用了128位 剩下一位补零。最早是美国人发明的 只支持英文 数字 和符号 一个字母是 8bit=1byte

随着计算机的世界普遍应用。各个国家创建了自己的编码系统如:中国的GB 后来衍生成GBK

GBK是由GB衍生而来,由中国方正公司编码研制 65536个bit 16位  但是其数量远小于中国的汉字数量。每个字占16bit=2byte

最早的世界性编码是UNICODE 为了全世界研制的编码 有32位 2**32个空位,但是因为占用空间比较大所以早期没有太广泛的使用。 每个字在unicode 中占 32bite=4byte

随后产生了utf-8 目前比较广泛应用的编码之一,他的特点是可以延长编码。如英文在utf-8中占8位 1byte 欧洲国家文字 占16位 2byte 中文 占24位 3byte.utf8是兼容ASCII编码的

 

posted @ 2018-09-04 21:26  蘑菇工程师  阅读(90)  评论(0编辑  收藏  举报