字节概念:
字节(Byte )是计算机信息技术用于计量存储容量的一种计量单位,作为一个单位来处理的一个二进制数字串,是构成信息的一个小单位。最常用的字节是八位的字节,即它包含八位的二进制数。
位:(bit):是计算机 内部数据 储存的最小单位,11001100是一个八位二进制数。
字节:(byte):是计算机中 数据处理 的基本单位,习惯上用大写 B 来表示,1B(byte,字节)= 8bit(位)。
字符概念
字符 是指计算机中使用的字母、数字、字和符号,包括:1、2、3、A、B、C、~!·#¥%……—*()——+等等。在UTF-8编码 中,一个英文字母字符存储需要1个字节,一个汉字字符储存需要3个字节。
一个英文就用八位二进制数表示,一个汉字就用3个八位二进制表示
字符串概念
字符串是字符序列,它是一种抽象的概念,不能直接存储在硬盘。
字节串概念
字节串是字节序列,它可以直接存储在硬盘。它们之间的映射被称为编码/解码。
在Python中,程序中的文本都用字符串表示。
python字节串和字符串代码介绍
>>> s = '中文' >>> s.encode() # 编码,默认的是UTF-8 b'\xe4\xb8\xad\xe6\x96\x87' # 字节串 >>> type(s.encode()) <class 'bytes'> # 字节串 >>> b'\xe4\xb8\xad\xe6\x96\x87'.decode(encoding='UTF-8') # 解码 '中文' # 字符串 >>> type(b'\xe4\xb8\xad\xe6\x96\x87'.decode(encoding='UTF-8')) <class 'str'> # 字符串
encode()编码函数,decode()解码函数
字节串是给计算机看的,给计算机传输或者保存的
字符串是给人看的,用来操作的