奇怪的 Python 整数缓存机制。
首先我们打开 Python 的解释器,在里面输入如下内容:
>>> a = 1024>>> b = 1024>>> a is bFalse>> a = 1024
>>> b = 1024
>>> a is b
False
当 a 和 b 的值皆为 1024 的时候,a is b 为 False,那这里我有一个问题:当 a 和 b 的值皆为 6 的时候,a is b 的输出结果是什么呢?
既然我都这么问了,肯定就不能是 False 了,不然问这个问题岂不是显得我很弱智?
>>> a = 6>>> b = 6>>> a is bTrue>> a = 6
>>> b = 6
>>> a is b
True
再次在解释器中输入,结果果然和之前的不一样,成了 True。
那么这是为什么呢?为什么待会告诉你,因为我想先讲一个更好玩的东西:is。
is 叫同一运算符,它用来比较两个对象的存储单元,实际比较的是对象的地址,来判断两个是不是引用同一个对象。
既然说到了「对象」,那就要说一说它的组成。
一个对象,不严谨点说是由三部分组成,即地址、类型和值(id、type & value)。比如在上面出现过的 a = 1000,id 是一串 xxxxx 的数字,type 是 int,value 是 1000,我们一直用的 == 就是比较 对象的 value 是不是一样。在内存中,id 的这一串 xxxxx 的数字其实是给了 a,is 去比较的时候其实是比较这个 id 是不是同一个。
至此,我们在回到文章开篇的问题上,既然 is 比较的是 id,那我们就分别来看一下 a 和 b 为 1000 和 为 6 时 id 的情况:
>>> a = 1000>>> b = 1000>>> id(a)4499125264>>> id(b)4499125360>>> a = 6>>> b = 6>>> id(a)4495136864>>> id(b)4495136864>> a = 1000
>>> b = 1000
>>> id(a)
4499125264
>>> id(b)
4499125360
>>> a = 6
>>> b = 6
>>> id(a)
4495136864
>>> id(b)
4495136864
结合我们在上面所说的 is 判断两个是不是引用同一个对象和上述代码中的 id 输出结果,照猫画虎,得出了一个结论:当 a 和 b 等于 1000 的时候,a 和 b 引用的不是同一个对象;当 a 和 b 等于 6 的时候,a 和 b 引用的是同一个对象!
是不是有点懵?一时懵圈一时爽,一直懵圈一直爽。其实这就是 Python 中的「整数缓存机制」在作怪!
在 Python 中,它会对比较小的整数对象进行缓存([-5, 256]),而并非是所有的整数对象。对于 a = 6 ,下次我想使用 6 这个对象,就可以直接使用,不用再新建了;对于 a = 1000,下次想使用 1000,就得需要重新建 1000 这个对象。
你以为这样就完了么?too naive!刚刚只是在命令行中执行的时候,当在 Pycharm 或者在文件中执行的时候,因为解释器做了部分优化,结果又完全不一样了,范围成了大于等于 -5 的任意整数。这个我就不在这演示了,有兴趣的同学可以自行尝试。
这个问题是源于一个读者问起,感觉比较有意思,就拿来写了一下。我感觉这些小的知识点我们也要注意一下,免得在某些小细节上翻船,越是在小的方面越能体现一个人基础是不是牢固。
End。