Python基础Day6
一、代码块
一个模块(模块就是py文件),一个函数,一个类,一个文件都是一个代码块,一个整体是一个代码块。
交互模式的每一行都是一个代码块(交互模式:命令提示符),相当于每行都在不同的文件
二、id
id就是对象的内存地址
相当于内存里空间的门牌号,每个id都是唯一的,找到内存地址就是对象,id相同就是指向同一个对象
在内存中id是唯一的,如果两个变量指向的id相同,就证明它们在内储存中是同一个
三、is
is 是判断两个变量的id是否相同
== 是判断两个变量的值是否相等
如果is是True,==一定是True;如果==是True,两个变量的id不一定相同
四、小数据池(缓存机制,驻留机制)
小数据池的作用的数据类型:整型、字符串、布尔值
python对内存做的一个优化:将-5~256的整数,以及一些规则的字符串,提前在内存中创建了池(容器),容器里固定存储了这些数
优点:
① 节省内存(不用每次创建变量都开辟内存空间)
② 提高性能与效率(减少运行时间)
缺点:在‘池’中创建或插入字符串,整数时,会花费更多的时间。
int:那么大家都知道对于整数来说,小数据池的范围是-5~256 ,如果多个变量都是指向同一个(在这个范围内的)数字,他们在内存中指向的都是一个内存地址。
str:字符串要从下面这几个大方向讨论:
1,字符串的长度为0或者1,默认都采用了驻留机制(小数据池)。
2,字符串的长度>1,且只含有大小写字母,数字,下划线时,才会默认驻留。
3,用乘法得到的字符串,分两种情况。
3.1 乘数为1时:
仅含大小写字母,数字,下划线,默认驻留。
含其他字符,长度<=1,默认驻留。
含其他字符,长度>1,默认驻留。
3.2 乘数>=2时:
仅含大小写字母,数字,下划线,总长度<=20,默认驻留。
五、代码块与小数据池
代码块内的缓存机制,和代码块与代码块之间的缓存机制不同!
python在同一个代码块中的变量,初始化对象的命令时,它会将变量与值的对应关系放到一个字典中。
如果下面的代码在遇到初始化对象的命令,它会先从字典中寻找,若存在相同的值,它会复用,指向的都是同一个内存地址。
对于同一个代码块的变量复用的问题,只能针对于数字,字符串,bool值,而对于其他数据类型是不成立的。
# 同一个代码块下,数字,字符串,bool值的复用成立。
a1 = 1000
a2 = 1000
print(id(a1),id(a2)) # 2419837390800 2419837390800
s1 = 'alexsb@'
s2 = 'alexsb@'
print(id(s1),id(s2)) # 2278732245624 2278732245624
f1 = True
f2 = True
print(id(f1),id(f2)) # 1672093872 1672093872
# 同一个代码块下,元祖,列表,字典的复用不成立。
tu1 = (1,2,3)
tu2 = (1,2,3)
print(id(tu1),id(tu2)) # 2278732278088 2278732279312
l1 = [1, 2, 3]
l2 = [1, 2, 3]
print(id(l1),id(l2)) # 2278733685000 2278733685192
dic1 = {'name':'taibai'}
dic2 = {'name':'taibai'}
print(id(dic1),id(dic2)) # 2278728382728 2278728382856
python对于不同的代码块:初始化对象的命令时,它会从小数据池中寻找。
六、编码
① 编码之间不能互相识别
② 网络传输、文件存储以二进制方式,必须是以非unicode的编码方式执行
大环境Python3 版本
str:内存(内部)的编码方式为unicode
bytes:python的基础数据类型之一,和str相当于双胞胎,str的所有方法,bytes类型都适用
str和bytes的表现形式:
s1 = 'aaa'
b1 = b'aaa'
print(s1,type(s1))
print(b1,type(b1))
# 结果
aaa <class 'str'>
b'aaa' <class 'bytes'>
str与bytes的区别:
①英文字母
str的形式: s1 = 'aaa'
str的内部编码形式:unicode
bytes的表现形式: b1 = b'aaa'
bytes的内部编码形式:非unicode(自定义编码格式)
②中文
bytes不能存储中文,会报错
所以要进行文件存储和网络传输,必须将str转换为bytes(str ---> bytes ---> 文件存储与网络传输)
bytes的使用方式:
如果想将一部分内容(字符串)写入文件,或者通过网络socket传输,这部分的内容(字符串)必须转化成bytes类型才可以进行。
平常写代码使用str即可。
str转换成bytes (str ---> bytes )
由于bytes不能存储中文,以非unicode编码的十六进制存储
s1 = '哈哈'
b1 = s1.encode('utf-8') # 指定转换的编码
print(b1,type(b1))
# 结果
b'\xe5\x93\x88\xe5\x93\x88' <class 'bytes'>
bytes转换成str (bytes ---> str)
b2 = b'\xe5\x93\x88\xe5\x93\x88'
s2 = b2.decode('utf-8') # bytes的编码,解码为str
print(s2,type(s2))
# 结果
哈哈 <class 'str'>
https://www.cnblogs.com/jin-xin/articles/9439483.html