十,编码
最基础的编码方式:二进制
机器能够理解的编码方式只有二进制编码。
所以一切的编程语言都要转换成二进制编码输入到cpu中执行
8位二进制数字可以表示256个十进制数字。
计算机中,每8位二进制数字就表示一个字节,是计算机存储的最小单位。bytes
1024bytes = 1kb
1024kb = 1mb
1024mb = 1gb
1024gb = 1tb
pb
eb
zb
yb
bb
等等
Ascci码:只能表示英文大小写字母、数字和一些特殊标点和图形字符。
由于断句问题,所有的ascci码都使用8位字符进行表示。如5位二进制数字前要用3位0进行填充。
但是不支持英文字母以外的其他字符。
中国自己的编码:GBK
两个字节表示一个中文汉字,但是不能支持全部的中文汉字,只支持常用的7445
使用16位二进制数字,也就是2个字节
万国码:unicode
每个字符都是用2个字节进行存储的。(???之前不是说是4个字节么???)
万国码升级版:utf-8
可以自动调整字节长度:
原来表示ascii的字符只用1个字节就可以表示了。
欧洲国家的文字使用2个字节表示
中文使用3个字节表示
如何在python2中调节编码?
可以在首行添加#! -*- coding:utf-8 -*- 转换成为utf-8编码
也可以使用#! encoding:utf-8 进行转换。
但是必须添加到首行,放在文档中不好使。