《流畅的Python》Object References, Mutability, and Recycling--第8章

Object References, Mutability, and Recycling

 

本章章节:

  • Variables Are Not Boxes
  • identity , Equality ,  Aliases
  • Copies are shallow by default
  • Function Parameters as references
  • del and Garbage Collection
  • Weak References
  • Tricks Python Plays with Immutable

Variables

翻译过来叫做变量,其实就是指针/标签。指向一个内存地址。而别名就是说同一个对象有多个标签。

identity

完全一样的两个对象,区别它们的是identity,Python使用id()函数得到一个对象的identity。

 

==符号是object.__eq__的语法糖。它会调用内存中的对象进行比较。

is符号是object.__id__的语法糖,只会比较对象的id,自然运行速度快于==。

 

Copies are shallow by default

tuple模式是浅层复制。使用list()或者copy()复制的是tuple内的第一层对象。

 

copy模块,深层复制

可用于深层的复制。

copy.copy(x)返回x层的浅层复制。

 

Function Parameters as References

call by sharing共享传参。这是Pyhon唯一支持的参数传递模式。Ruby等OO对象语言都是这种模式。

一个函数可以改变传递给它,作为参数的可变对象(multable object)的值,但不能改变对象的identity。

 

形式参数是别名:

例子:

def f(a, b):
    print(id(a), id(b))  #
    a += b
    print(id(a))
    return a

x = 1
print("id(x) is %s" % id(x))
y = 2
print("id(y) is %s" % id(y))
f(x, y)

 

id(x) is 4565326480
id(y) is 4565326512
4565326480 4565326512
4565326544

由此可知,x和a, y和b都是同一个对象的引用。所以说a, b只是别名。

而a += b代码中的a, 的id改变了。这代表它引用的是另一个不可变对象(整数)。

 

改变可变对象的值

对上面的例子进行修改:

def f(a, b):
    print(id(a), id(b))  #
    a += bprint("change variable a, but its id not change: {}".format(id(a)))
    return a

x = [1, 2]
print("id(x) is %s" % id(x))
y = [2, 3]
print("id(y) is %s" % id(y))
print("return is {}".format(f(x, y)))
print("x is {}".format(x))

 x是一个list,属于可变对象。

id(x) is 4545995264
id(y) is 4545996928
4545995264 4545996928
change variable a, but its id not change: 4545995264
return is [1, 2, 2, 3]
x is [1, 2, 2, 3]

由此验证了一个函数可以改变传递给它,作为参数的可变对象(multable object)的值,但不能改变对象的identity。

 

如果把x,y改成一个tuple,那么函数不能对x进行修改了。

 

call by share原理,不要把可变对象作为默认的参数。

这个原理体现了一些方便。但是:

class HauntedBus:
    def __init__(self, passengers = []):
        self.passengers = passengers

    def pick(self, name):
        self.passengers.append(name)
bus1 = HauntedBus()
bus1.passengers.append("Tom")
print("bus1 has {}".format(bus1.passengers))
bus2 = HauntedBus()
print("bus2 has {}".format(bus2.passengers))

结果竟然是:

bus1 has ['Tom']
bus2 has ['Tom']

 

 bus2也有了一个乘客Tom!

 原因就是因为它们共享了一个参数passengers,它是一个list类型,是可变参数。由于共享,所以出现了两个对象数据混淆的问题。

 背后的过程是:passengers = []是在模块加载时,定义函数的过程中被计算。

 

避免也简单,如果需要传入数据,在函数内进行复制,使用复制的数据。

 


 

del and Garbage Collection

Object不会被自行销毁,但是当认为是垃圾时,就会被当作垃圾回收。

del命令删除的是name, 而不是对象本身。(name就是指向对象的指针)。

当一个对象,没有指针来引用它,那么就被当成是垃圾,最后被销毁。

 

垃圾回收的算法机制:reference counting

每个对象有一个计数,记录对它的引用(指针)有多少个,当为0个时,对象就会被销毁。

CPython会调用__del__方法,对象被销毁,释放内存。

 

当然Python除了reference counting这种回收机制,还有更复杂的垃圾回收机制。

 

例子:

>>> import weakref
>>> si  = {1, 2, 3}
>>> s = si
>>> def bye():
...     print("Gone with the wind...")
>>> ender = weakref.finalize(si, bye)
>>> ender.alive
True
>>> del si
>>> ender.alive
True
>>> s = None
Gone with the wind...
>>> ender.alive
False
>>> ender
<finalize object at 0x103892c70; dead>

 

解释:

1.模块weakref,用来创建对象的弱引用。术语referent表示使用“弱引用”引用“引用的对象”。⚠️弱引用不会被对象进行引用计数ref count。

2, si和s共同引用一个dict。

3.   当del si后,实际是删除si这个引用,而不是删除dict.

4.   当s指向其他对象时,原对象的ref count变为0,因此启动垃圾回收机制,dict被删除,内存释放。

5.   weakref.finalize(obj, func,)方法,返回一个可调用对象的终结器对象,用来管理对象的生存周期。 

 

Weak References

不会被对象记录的引用。主要用于缓存。被弱引用所指向的对象叫做referent。

>>> class MyClass:
...     pass
>>> o = MyClass()
>>> r = weakref.ref(o)
>>> r
<weakref at 0x103a63b30; to 'MyClass' at 0x103a6f790>
>>> o2 = r()
>>> o2
<__main__.MyClass object at 0x103a6f790>
>>> o is o2
True
>>> del o, o2
>>> print(r())
None
>>> r
<weakref at 0x103a63b30; dead>

 使用ref(obj)创建一个弱引用r对象,  r()返回被引用的对象自身。

 当两个引用都被删除,引用对象就被垃圾回收机制所删除,这时r对象,内显示一个dead标记,表示r并没有引用的对象。

 

需要注意的⚠️: 

如果在平时使用时,不建议使用ref来创建弱引用对象,因为weakref.ref其实时一个底层接口,供高级用途使用的。比如finalize()或者weakref集合

 

这个原因时因为在微观管理内存时,往往会得到意外的结果,比如不明显的隐式赋值会为对象创建新引用。

《流畅的python》的实例8-17举了一个例子:

控制台的_变量会自动绑定到结果不为None的表达式结果上,因此会对调用跟踪对象产生意料之外的引用。例子:

>>> import weakref
>>> s = {1}
>>> wref = weakref.ref(s)
>>> wref
<weakref at 0x1022a7a40; to 'set' at 0x1022a5900>
>>> wref()       #_变量自动的引用了{1}。
{1}
>>> s = "hello"
>>> wref()      #虽然s不在指向{1},但此时_变量还指向{1}, 因此{1}仍然存在,所以使用wref()可以返回被引用的对象{1}
{1}
>>> wref() is None  #这个表达式返回False,代表此时{1}存在,但_变量重新指向了False,因此{1}的引进计数变为0,启动垃圾回收。
False
>>> wref() is None  #wref()返回None。
True
>>> wref
<weakref at 0x1022a7a40; dead>

 

 

小结:

weakref其实就是配合垃圾回收来管理缓存的工具,上面讲解了弱引用的正常使用,它的原理,和背后的缺陷。并强调不要直接使用ref方法。

 

WeakValueDictionary类的简介

常用的管理缓存的工具类。

它的实例是一个mutable mapping, 其中value是对某个对象的弱引用。当相关的某个对象被垃圾收集后,weakValueDictionary实例中对应的key会自动的被移除。

除了WeakValueDictionary外还有WeakKeyDictionary,它的key是弱引用。

 

弱引用的局限

Python对象中,有些对象是不能被弱引用的:

  • int, tuple类的实例及相关子类的实例都不能弱引用。
  • dict和list类的实例不能弱引用,但子类可以。

 

 


 

 

Tricks Python Plays with Immutables

CPython的一些优化细节,对一般用户来说不重要。

>>> s1= "hi,world"
>>> s2= "hi,world"
>>> s1 is s2
False
>>> s3 = "abc"
>>> s4 = "abc"
>>> s3 is s4
True
>>> id(s3)
4362478384
>>> id(s4)
4362478384
>>> id(s1)
4363433648
>>> id(s2)
4363433264

 

解释:

上面s3之所以s4指向同一个对象,是因为"abc"是一个非常常用的字符串字面量,因此Python核心开发者对它做了优化,叫做interning, 扣押/驻留。

⚠️,使用==来判断,is是解释器内部常用的特征。

 

 

 

 

 

 

 

 

 

 

 

posted @ 2019-12-15 10:53  Mr-chen  阅读(237)  评论(0编辑  收藏  举报