python学习随笔(四)_内置数据结构_bytes,bytearray

python3新引入两个新类型
   bytes   #不可变字节序列
   bytearray   #字节数组,可变   #用的少
字符串与bytes
   字符串是字符组成的有序序列，字符可以使用编码来理解
   bytes是字节组成的有序的不可变序列
   bytearray是字节组成的有序的可变序列

编码与解码
   字符串按照不同的字符集编码encode返回字节序列bytes
       encode(encoding='utf-8', errors='strict') -> bytes
   字节序列按照不同的字符集解码decode返回字符串
       bytes.decode(encoding="utf-8", errors="strict") -> str
       bytearray.decode(encoding="utf-8", errors="strict") -> str

ASCII
ASCII（American StandardCode for InformationInterchange，美国信息交换标准代码）是基于拉丁字母的一套单字节编码系统
所有字节都可以用ASCII编码,一切字节都可以当文本理解

bytes定义
   bytes()空bytes
   bytes(int)指定字节bytes,被0填充
   bytes(iterable_of_ints) -> bytes [0,255]的int组成的可迭代对象
   bytes(string, encoding[, errors]) -> bytes 等价于string.encode()
   bytes(bytes_or_buffer) -> immutable copy of bytes_or_buffer 从一个字节序列或者buffer复制出
       一个新的不可变的bytes对象
   使用b前缀定义
       只允许基本ASCII使用字符形式b'abc9'
       使用16进制表示b"\x41\x61"

bytes操作
   和str类型类似，都是不可变类型，所以方法很多都一样。只不过bytes的方法，输入是bytes，输出是
       bytes
           b'abcdef'.replace(b'f',b'k')   #b'abcdek'   k替换f
           b'abc'.find(b'b')       #1       找得是相同类型
   类方法 bytes.fromhex(string)
       string必须是2个字符的16进制的形式，'6162 6a 6b'，空格将被忽略
       bytes.fromhex('6162 09 6a 6b00')   #b'ab\tjk\x00'
   hex()
       返回16进制表示的字符串
       'abc'.encode().hex()       #'616263'
   索引
       b'abcdef'[2] 返回该字节对应的数，int类型   #99(a是97,c是99)

bytearray定义
   bytearray() 空bytearray
   bytearray(int) 指定字节的bytearray，被0填充
   bytearray(iterable_of_ints) -> bytearray [0,255]的int组成的可迭代对象
   bytearray(string, encoding[, errors]) -> bytearray 近似string.encode()，不过返回可变对象
   bytearray(bytes_or_buffer) 从一个字节序列或者buffer复制出一个新的可变的bytearray对象
**注意，b前缀定义的类型是bytes类型

bytearray操作
   和bytes类型的方法相同
       bytearray(b'abcdef').replace(b'f',b'k')   #bytearray(b'abcdek')
       bytearray(b'abc').find(b'b')       #1
   类方法 bytearray.fromhex(string)
       string必须是2个字符的16进制的形式，'6162 6a 6b'，空格将被忽略
       bytearray.fromhex('6162 09 6a 6b00')   #bytearray(b'ab\tjk\x00')
   hex()
       返回16进制表示的字符串
       bytearray('abc'.encode()).hex()   #'616263'
   索引
       bytearray(b'abcdef')[2] 返回该字节对应的数，int类型   #99

bytearray操作
   append(int) 尾部追加一个元素
   insert(index, int) 在指定索引位置插入元素
   extend(iterable_of_ints) 将一个可迭代的整数集合追加到当前bytearray
   pop(index=-1) 从指定索引上移除元素，默认从尾部移除
   remove(value) 找到第一个value移除，找不到抛ValueError异常
***注意：上述方法若需要使用int类型，值在[0, 255]
   clear() 清空bytearray
   reverse() 翻转bytearray，就地修改
b = bytearray()
b.append(97)
b.append(99)
b.insert(1,98)
b.extend([65,66,67])
b.remove(66)
b.pop()
b.reverse()
b.clear()

int和bytes
   int.from_bytes(bytes, byteorder)
       将一个字节数组表示成整数
   int.to_bytes(length, byteorder)
       byteorder字节序
       将一个整数表达成一个指定长度的字节数组
i = int.from_bytes(b'abc', 'big')
print(i, hex(i))        # 6382179 0x616263
print(i.to_bytes(3, 'big'))   # b'abc'

----------------------------------------------------------------

线性结构
   可迭代 for ... in
   len()可以获取长度
   通过下标可以访问
   可以切片
学过的线性结构
   列表、元组、字符串、bytes、bytearray

切片   #start要在stop左边,stop大于start
   切片(中间调用了copy)
   通过索引区间访问线性结构的一段数据
   sequence[start:stop] 表示返回[start, stop)区间的子序列
   支持负索引
   start为0，可以省略
   stop为末尾，可以省略
   超过上界（右边界），就取到末尾；超过下界（左边界），取到开头
   start一定要在stop的左边
   [:] 表示从头至尾，全部元素被取出，等效于copy()方法

步长切片       #有步长后start和stop在谁那边都可以只要三个数方向一致就可以,从小到大切
   [start:stop:step]
   step为步长，可以正、负整数，默认是1
   step要和start:stop同向，否则返回空序列

posted @ 2018-08-19 22:02 亦泉阅读(1220) 评论(0) 收藏举报

刷新页面返回顶部

亦泉

python学习随笔(四)_内置数据结构_bytes,bytearray

公告