Python字节数组【bytes/bytearray】
bytes
>>> type(b'xxxxx') <class 'bytes'> >>> type('xxxxx') <class 'str'>
bytes是byte的序列,而str是unicode的序列。
1、str 转换成 bytes 用 encode() 方法:(注意:这有个坑,str1.encode不加括号和加括号是不一样的,自己试试,初学貌似2.0不影响,3.0变了,不加括号开发环境语法不报错)
str = '人生苦短,我用Python!' bytes = str.encode() print(bytes)
输出:
b'\xe4\xba\xba\xe7\x94\x9f\xe8\x8b\xa6\xe7\x9f\xad\xef\xbc\x8c\xe6\x88\x91\xe7\x94\xa8Python!'
2、好了,反转换 decode() :
bytes = b'\xe4\xba\xba\xe7\x94\x9f\xe8\x8b\xa6\xe7\x9f\xad\xef\xbc\x8c\xe6\x88\x91\xe7\x94\xa8Python!' str = bytes.decode() print(str)
输出:
人生苦短,我用Python!
bytearray
1、bytearray和bytes不一样的地方在于,bytearray是可变的。
str = '人生苦短,我用Python!' bytes = bytearray(str.encode()) bytes = bytearray(b'\xe4\xba\xba\xe7\x94\x9f\xe8\x8b\xa6\xe7\x9f\xad\xef\xbc\x8c\xe6\x88\x91\xe7\x94\xa8Python!') str = bytes.decode() print(str)
输出:
'人生苦短,我用Python!'
2、改变bytearray
bytes[:6] = bytearray('生命'.encode()) bytes = bytearray(b'\xe7\x94\x9f\xe5\x91\xbd\xe8\x8b\xa6\xe7\x9f\xad\xef\xbc\x8c\xe6\x88\x91\xe7\x94\xa8Python!') str = bytes.decode() print(str)
输出:
生命苦短,我用Python!
各种 bytes :
a = bytes('abc', 'utf-8') print(a) > b'abc' b = bytes(1) print(b) > b'\x00' c = bytes([2,3,6,8]) print(c) > b'\x02\x03\x06\x08' print(b"Python") > b'Python' python = (b'P' b'y' b"t" b'o' b'n') print(python) > b'Pyton'
Bytes 代表的是(二进制)数字的序列,只不过在是通过 ASCII
编码之后才是我们看到的字符形式,如果我们单独取出一个字节,它仍然是一个数字:
print(b"Python"[0])
> 80
我们可以用 b"*"
的形式创建一个字节类型,前提条件是这里的 *
必须是 ASCII
中可用的字符,否则将会超出限制:
print(b"雨") > File "", line 1 print(b"雨") ^ SyntaxError: bytes can only contain ASCII literal characters.
错误提示说明:字节类型只能允许 ASCII 字符(0~127~255)。ASCII
表里面所有的字符只占据了 [31, 127]
那对于这一范围之外的数字我们要怎么才能表示为字节类型?答案就是用特殊的转义符号x
+十六进制数字 :
print(b'xff'[0]) > 255 print(b'x24') > b'$'
反过来我们也可以将数字(0~255)转变成转义后的字节类型:
print(bytes([24]))
> b'x18' print(bytes([36,36,36])) # 记住字节类型是一个序列
或者直接从十六进制得来:
print(bytes.fromhex("7b 7d")) > b'{}'
# 逆运算 print(b'{ }'.hex())
> 7b207d int(b' '.hex(), base=16)
> 32
测试的一些代码:
print("$".encode('ascii'))
> b'$' print("$".encode('ascii')[0])
> 36
ba = bytearray(b'hello')
ba[0:1] = b'w'
print(ba)
bytearray(b'wello')
可是如果我们对一些奇怪的字符进行 ASCII
编码,就会发生异常:ordinal not in range(128)