十,编码

最基础的编码方式:二进制

  机器能够理解的编码方式只有二进制编码。

  所以一切的编程语言都要转换成二进制编码输入到cpu中执行

  8位二进制数字可以表示256个十进制数字。

  计算机中,每8位二进制数字就表示一个字节,是计算机存储的最小单位。bytes

  1024bytes = 1kb

  1024kb = 1mb

  1024mb = 1gb

  1024gb = 1tb

  pb

  eb

  zb

  yb

  bb

  等等

Ascci码:只能表示英文大小写字母、数字和一些特殊标点和图形字符。

  由于断句问题,所有的ascci码都使用8位字符进行表示。如5位二进制数字前要用3位0进行填充。

  但是不支持英文字母以外的其他字符。

 

中国自己的编码:GBK

  两个字节表示一个中文汉字,但是不能支持全部的中文汉字,只支持常用的7445

  使用16位二进制数字,也就是2个字节

 

万国码:unicode

  每个字符都是用2个字节进行存储的。(???之前不是说是4个字节么???)

 

万国码升级版:utf-8

  可以自动调整字节长度:

  原来表示ascii的字符只用1个字节就可以表示了。

  欧洲国家的文字使用2个字节表示

  中文使用3个字节表示

  

如何在python2中调节编码?

  可以在首行添加#! -*- coding:utf-8 -*- 转换成为utf-8编码

  也可以使用#! encoding:utf-8  进行转换。

  但是必须添加到首行,放在文档中不好使。

 

  

  

posted on 2019-01-11 07:12  王汉尧  阅读(236)  评论(0编辑  收藏  举报