python基础(8)python中is和==的区别详解
前置知识点
当我们创建一个对象时,我们要知道它内部干了些什么
- 1.创建了一个随机id,开辟了一片内存地址
- 2.自动声明了这个对象的类型type
- 3.给这个对象赋值value
小例子
a = 1
print(id(1))
print(id(a))
print(type(a))
结果
4470700832
4470700832
<class 'int'>
可以明显看出数字1的内存地址跟对象a的内存地址是一样的,a = 1
的原理是首先内存中有一个id=4470700832
,type=int
,value=1
的对象,然后创建a对象指向1,此时a的id、type、value跟1的一样
is和==的区别
上面分析了创建对象的整个内存过程,那么接下来理解is和==的区别就好多了
- is:用于判断两个变量引用对象是否为同一个,既比较对象的地址。
- ==:用于判断引用变量引用对象的值是否相等,默认调用对象的
__eq__()
方法。
>>> a = 257
>>> b = 257
>>> id(a)
140204598140720
>>> id(b)
140204598140400
>>> print(a is b)
False
>>> print(a == b)
True
根据我们上面讲解的,a的地址和b的地址应该跟257的地址相同,但是现在显然不同,这是为什么呢?下面会说明
整数缓存问题
Python 仅仅对比较小的整数对象进行缓存(范围为[-5, 256])
缓存起来,而并非是所有整数对象。需要注意的是,这仅仅是在命令行中执行,而在Pycharm
或者保存为文件执行,结果是不一样 的,这是因为解释器做了一部分优化(范围是[-5,任意正整数])。
总结
- is 比较两个对象的 id 值是否相等,是否指向同一个内存地址
- == 比较的是两个对象的内容是否相等,值是否相等
- 小整数对象[-5,256]在全局解释器范围内被放入缓存供重复使用
- is 运算符比 == 效率高,在变量和 None 进行比较时,应该使用 is。
字符串驻留机制
什么是字符串驻留?
字符串驻留是一种仅保存一份相同且不可变字符串的方法。
基本原理
系统维护interned
字典,记录已被驻留的字符串对象。
当字符串对象a需要驻留时,先在interned
检测是否存在,若存在则指向存在的字符串对象,a的引用计数减1;
若不存在,则记录a到interned
中
为什么要字符串驻留?
- 显而易见,节省大量内存
- 在字符串比较时,非驻留比较效率o(n),驻留时比较效率o(1)。
字符串什么时候驻留?
1.字符串只在编译时进行驻留,而非运行时。
>>> a = "hello" + "world"
>>> a is "helloworld"
True
>>> a = "hello"
>>> b = "world"
>>> a + b is "helloworld"
False
2. 字符串长度为0和1时,默认都采用了驻留机制。
>>> a = "*"
>>> b = "*"
>>> a is b
True
>>> a = "**"
>>> b = "**"
>>> a is b
False
3. 字符串>1时,且只含大小写字母、数字、下划线时,才会默认驻留。
>>> a = "hello1_"
>>> b = "hello1_"
>>> a is b
True
>>> a = "hello!"
>>> b = "hello!"
>>> a is b
False
4. 用乘法得到的字符串,有以下2种情况。
- a. 乘数为1时,详见Python代码:
# 乘数=1,仅含大小写字母、数字、下划线驻留
>>> a = "abcdefghijklmnopqrstuvwxyz1234567890_ABCDXYZ"
>>> b = a * 1
>>> a is b
True
# 乘数=1,含其他字符,长度≤1,默认驻留
>>> a = "#"
>>> b = "#" * 1
>>> a is b
True
# 乘数=1,含其他字符,长度>1,则不驻留
>>> a = "##"
>>> b = "##" * 1
>>> a is b
False
- b.乘数>=2时,详见Python代码:
## 仅含有大小写字母、数字、下划线,默认驻留
>>> a = "hellohellohellohellohellohellohello"
>>> b = "hello"*7
>>> a is b
True
# 含其他字符串,默认不驻留
>>> a = "&&&&"
>>> b = "&"*4
>>> a is b
False
5. 字符串被sys.intern() 指定驻留。
>>> from sys import intern
>>> a = intern("hello#!")
>>> b = intern("hello#!")
>>> a is b
True
>>>
最后,当不满足标识符规则时,则不会启用驻留机制,当然这只出现在命令行中,如果你使用pycharm
则不会出现这样的情况,pycharm
内部已经帮我们做了处理