Python中的浅拷贝与深拷贝
编者注:本文主要参考了《Python核心编程(第二版)》
以下都是参考资料后,我自己的理解,如有错误希望大家不吝赐教。
大家有没有遇到这样一种情况,对象赋值后,对其中一个变量进行修改,另外一个变量的值也改变了。比如:
person = ['name', ['saving', 100]] hubby = person wifey = person hubby[0] = 'joe' wifey[0] = 'jane' print hubby, wifey hubby[1][1] = 50 print hubby, wifey >>>['jane', ['saving', 100]] ['jane', ['saving', 100]] ['jane', ['saving', 50]] ['jane', ['saving', 50]]
以上的对象赋值实际上是简单的对象引用。也就是说当你创建一个对象,然后把他赋给另一个变量的时候,python并没有拷贝这个对象,而是拷贝了这个对象的引用。可以看出,hubby,wifey只是拷贝了person的引用,且是对person变量名,即列表整体的引用。
person = ['name', ['saving', 100]] hubby = person wifey = person print [id(x) for x in person,hubby,wifey] print [id(x) for x in person] print [id(x) for x in hubby] print [id(x) for x in wifey] >>>[58507784L, 46008008L, 46008968L] [37770104L, 58507336L] [37770104L, 58507336L] [37770104L, 58507336L]
可以看出,三个变量地址不一样,但三个变量的内容的地址一样,所以赋值后显示的结果一样。
常使用的浅拷贝类型有:
(1)完全切片操作[:]
(2)利用工厂函数list(),dict()等
(3)使用copy模块的copy函数
person = ['name', ['saving', 100]] hubby = list(person) wifey = person[:] print [id(x) for x in person,hubby,wifey] print [id(x) for x in person] print [id(x) for x in hubby] print [id(x) for x in wifey] hubby[0] = 'joe' wifey[0] = 'jane' print hubby, wifey hubby[1][1] = 50 print hubby, wifey >>>[56541704L, 45680328L, 56541640L] [37573496L, 56541256L] [37573496L, 56541256L] [37573496L, 56541256L] ['joe', ['saving', 100]] ['jane', ['saving', 100]] ['joe', ['saving', 50]] ['jane', ['saving', 50]]
为什么这种浅拷贝hubby,wifey的名字不一样呢?第二个列表中值一样呢?因为list()和完全切边操作[:]是将person里的每个内容赋值,是对序列的引用。且这两个列表中第一个对象(字符串类型)是不可变的,第二个对象(一个列表)是可变的。正因如此,当进行浅拷贝时,字符串被显示的拷贝,并创建了一个字符串对象。而列表元素只是把它的引用复制了一下,并不是它的成员。
注意:
第一,非容器类型(比如数字,字符串,和其他‘原子’类型的对象,像xrange等)没有拷贝一说,浅拷贝是用完全切片操作完成的。第二,如果元组变量只包含原子类型对象,它的深拷贝将不会进行,只能得到一个浅拷贝。
import copy person = ['name', ('saving', 100)] hubby = person wifey = copy.deepcopy(person) print [id(x) for x in person,hubby,wifey] print [id(x) for x in person] print [id(x) for x in hubby] print [id(x) for x in wifey] >>>[56902216L, 56902216L, 56902152L] [42095480L, 44124104L] [42095480L, 44124104L] [42095480L, 44124104L]