字符、字节的概念和区别;编码概念

字节(byte)

 字节是通过网络传输信息(或在硬盘或内存中存储信息)的基本单位。字节是计算机信息技术用于计量存储容量和传输容量的一种计量单位1个字节等于8位二进制它是一个8位的二进制数,是一个很具体的存储空间。

 

字符

人们使用的记号,抽象意义上的一个符号。比如键盘上敲出的数字、字母、各种符号........ '1', '中', 'a', '$', '¥', ……

 

 

字符要通过编码才能被计算机认识,计算机只认识高(1)低(0)电平:101011100000酱紫的,so,只有最终被解释为1010001011的二进制才能被计算机识别

字符------->编码----------->010101010010000000000

这个过程,其实就是一个字符怎么对应一段特定的数字的标准,这个标准也叫作编码标准

 

 

总结:ASCII,一个Bytes代表一个字符(英文字符/键盘上的所有其他字符)1Bytes=8bit,8bit可以表示0-2**8-1种变化,即可以表示256个字符,ASCII最初只用了后七位,127个数字,已经完全能够代表键盘上所有的字符了(英文字符/键盘的所有其他字符),后来为了将拉丁文也编码进了ASCII表,将最高位也占用了。

 即:AXCII采用8bit(1字节)存放字符

   Unilde采用16bit(2字节)存在字符

ANSI以单字节存放英文字符以双字节存放中文等字符,而Unicode下,英文和中文的字符都以双字节存放

 这两个是不能兼容的

我们可以简单的记这样一个结论:按照ANSI编码标准,标点符号、数字、大小写字母都占一个字节,汉字占2个字节。按照UNICODE标准所有字符都占2个字节。

 

 

 

 

 

 

1、文件是以什么方式编码的,就会以什么方式打开

如果不在python文件指定头信息#-*-coding:utf-8-*-,那就使用默认的python2中默认使用asciipython3中默认使用utf-8

 

posted @ 2019-03-28 09:37  littlepoemers_23ujhs  阅读(1191)  评论(0编辑  收藏  举报