Python字节数组【bytes/bytearray】

bytes

>>> type(b'xxxxx')
<class 'bytes'>

>>> type('xxxxx')
<class 'str'>

bytes是byte的序列,而str是unicode的序列。

 

1、str 转换成 bytes 用 encode() 方法:(注意:这有个坑,str1.encode不加括号和加括号是不一样的,自己试试,初学貌似2.0不影响,3.0变了,不加括号开发环境语法不报错)

str = '人生苦短,我用Python!'
bytes = str.encode()
print(bytes)

输出:

b'\xe4\xba\xba\xe7\x94\x9f\xe8\x8b\xa6\xe7\x9f\xad\xef\xbc\x8c\xe6\x88\x91\xe7\x94\xa8Python!'

2、好了,反转换 decode() :

bytes = b'\xe4\xba\xba\xe7\x94\x9f\xe8\x8b\xa6\xe7\x9f\xad\xef\xbc\x8c\xe6\x88\x91\xe7\x94\xa8Python!'
str = bytes.decode()
print(str)

输出:

人生苦短,我用Python!

bytearray

1、bytearray和bytes不一样的地方在于,bytearray是可变的。

str = '人生苦短,我用Python!'
bytes = bytearray(str.encode())
bytes = bytearray(b'\xe4\xba\xba\xe7\x94\x9f\xe8\x8b\xa6\xe7\x9f\xad\xef\xbc\x8c\xe6\x88\x91\xe7\x94\xa8Python!')
str = bytes.decode()
print(str)

输出:

'人生苦短,我用Python!'

2、改变bytearray

bytes[:6] = bytearray('生命'.encode())
bytes = bytearray(b'\xe7\x94\x9f\xe5\x91\xbd\xe8\x8b\xa6\xe7\x9f\xad\xef\xbc\x8c\xe6\x88\x91\xe7\x94\xa8Python!')
str = bytes.decode()
print(str)

输出:

生命苦短,我用Python!

各种 bytes :

a = bytes('abc', 'utf-8')  
print(a)
> b'abc'

b  = bytes(1)  
print(b)
> b'\x00'

c = bytes([2,3,6,8])  
print(c)
> b'\x02\x03\x06\x08'

print(b"Python")
> b'Python'

python = (b'P' b'y' b"t" b'o' b'n')
print(python)
> b'Pyton'

 

 Bytes 代表的是(二进制)数字的序列,只不过在是通过 ASCII 编码之后才是我们看到的字符形式,如果我们单独取出一个字节,它仍然是一个数字:

print(b"Python"[0])
> 80

我们可以用 b"*" 的形式创建一个字节类型,前提条件是这里的 * 必须是 ASCII 中可用的字符,否则将会超出限制:

print(b"")
> File "", line 1
   print(b"")
         ^
SyntaxError: bytes can only contain ASCII literal characters.

错误提示说明:字节类型只能允许 ASCII 字符(0~127~255)。ASCII 表里面所有的字符只占据了 [31, 127]

那对于这一范围之外的数字我们要怎么才能表示为字节类型?答案就是用特殊的转义符号x+十六进制数字 :

print(b'xff'[0])
> 255
print(b'x24')
> b'$'

反过来我们也可以将数字(0~255)转变成转义后的字节类型:

print(bytes([24]))
> b'x18'
print(bytes([36,36,36])) # 记住字节类型是一个序列

或者直接从十六进制得来:

print(bytes.fromhex("7b 7d"))
> b'{}'
# 逆运算 print(b'{ }'.hex())
> 7b207d int(b
' '.hex(), base=16)
> 32

测试的一些代码:

print("$".encode('ascii'))
> b'$'
print("$".encode('ascii')[0])
> 36

ba = bytearray(b'hello')
ba[0:1] = b'w'
print(ba)
bytearray(b'wello')

可是如果我们对一些奇怪的字符进行 ASCII 编码,就会发生异常:ordinal not in range(128)

 

posted @ 2018-01-12 16:39  fieldtianye  阅读(62596)  评论(0编辑  收藏  举报