[Python]列表复制以及切片[:][::]解析
虽然这个复制问题已经很清楚了,但是还是综合一下记录下来,让概念理解更清晰。
摘自:
深拷贝和牵拷贝
深拷贝和浅拷贝最根本的区别在于是否真正获取一个对象的复制实体,而不是引用。
假设B复制了A,修改A的时候,看B是否发生变化:
如果B跟着也变了,说明是浅拷贝,拿人手短!(修改堆内存中的同一个值)
如果B没有改变,说明是深拷贝,自食其力!(修改堆内存中的不同的值)
浅拷贝(shallowCopy)只是增加了一个指针指向已存在的内存地址,
深拷贝(deepCopy)是增加了一个指针并且申请了一个新的内存,使这个增加的指针指向这个新的内存,
使用深拷贝的情况下,释放内存的时候不会因为出现浅拷贝时释放同一个内存的错误。
浅复制:仅仅是指向被复制的内存地址,如果原地址发生改变,那么浅复制出来的对象也会相应的改变。
深复制:在计算机中开辟一块新的内存地址用于存放复制的对象。
浅复制只会将对象的各个属性进行复制,并不会进行递归复制
Python实例解析
new = old[:]
Python老鸟都知道以上代码是什么意思。它复制列表old到new。它对于新手来说是种困惑而且应该避免使用这种方法。不幸的是[:]标记法被广泛使用,可能是Python程序员不知道更好的列表复制法吧。
首先我们需要了解Python是如何管理对象和变量。Python没有C语言中的变量。在C语言中,变量不止是个名字,它是字节集合并真实存在于内存某个位置上。而在Python中,变量仅仅是指向对象的标签。
看看以下语句:
a = [1, 2, 3]
它表示我们创建了一个指引指向列表[1, 2, 3],但是a不是列表。如果:
b = a
我们并没有复制a所指引的列表。我们只是创建了一个新的标签b,然后将其指向a所指向的列表。
如果你修改a,那你就同时修改了b,因为它们指向同一个列表:
>>> a = [1, 2, 3]
>>> b = a
>>> a.append(4)
>>> print a
[1, 2, 3, 4]
>>> print b
[1, 2, 3, 4]
内建函数id()可以返回对象的唯一id。该id是对象的内存地址。
>>> id(a)
3086056
>>> id(b)
3086056
>>> c = [] # Create a new list
>>> id(c)
2946712
可以看出a和b都指向同一个内存地址。c指向一个新建的空列表,因此指向了不同的地址。
现在我们要复制a指引的列表。我们必须创建新的列表,然后使用b指引它。
这其实就是 new = old[:]。切片运算符[:]返回一个序列的切片。切片过程是切下列表的一部分,创建新的列表,将切下的部分复制到新列表。
>>> a[1:3]
[2, 3]
>>> id(a)
3086056
>>> id(a[1:3])
3063400
省略第一个索引值,切片从列表开始,省略第二个索引值,切片直到列表末端。
>>> a[:3]
[1, 2, 3]
>>> a[1:]
[2, 3, 4]
切片反转,等间距获得列表元素
>>> a = [1,2,3]
>>>
>>> a[::-1] #反转
[3, 2, 1]
>>>
>>> a[::2] #以2-1的间隔捕获列表元素
[1, 3]
>>>
>>>
通过调用a[:],我们得到一个从列表首端开始到末端的切片,也就是a(指引的列表)的完整复制。但这不是复制列表的唯一方式。看看下面这个情况:
>>> b = list(a)
>>> id(a)
3086056
>>> id(b)
3086256
这个是不是看起来更好,少一些隐式,更加pythonic?a[:]看起来有点太像Perl。不同于切片标记法,不了解Python的人也会明白b是一个列表。
list()是列表构造函数。它会在传入的数列基础上新建一个列表。数列不一定是列表,它可以是任何类型的数列。
>>> my_tuple = (1, 2, 3)
>>> my_list = list(my_tuple)
>>> print my_list
[1, 2, 3]
>>> id(my_tuple)
3084496
>>> id(my_list)
3086336
而且它还接受生成器。切片笔记法不适用于生成器,因为生成器是不可更改。你不能generator[0],例如:
>>> generator = (x * 3 for x in range(4))
>>> list(generator)
[0, 3, 6, 9]
百分之九十的切片标记法都可以被list()代替。下次你看见[:]的时候试试使用list()替代,这样可以让你的代码更加可读。记住,魔鬼藏在细节里
五种复制方法的比较
>>> import copy
>>> a = [[10], 20]
>>> b = a[:]
>>> c = list(a)
>>> d = a*1
>>> e = copy.copy(a)
>>> f = copy.deepcopy(a)
>>>
>>> id(a)
140519009581728
>>> id(b),id(c),id(d),id(e),id(f)
(140519009841232, 140519009841712, 140519009841312, 140519009841872, 140519009841472)
>>>
>>> a.append(30)
>>>
>>> a[0].append(11)
>>>
>>> id(a),a
(140519009581728, [[10, 11], 20, 30])
>>> id(b),b
(140519009841232, [[10, 11], 20])
>>> id(c),c
(140519009841712, [[10, 11], 20])
>>> id(d),d
(140519009841312, [[10, 11], 20])
>>> id(e),e
(140519009841872, [[10, 11], 20])
>>> id(f),f
(140519009841472, [[10], 20])
>>>
从以上可以看出,使用 a[:], list(a), a*1, copy.copy(a)四种方式复制列表结果都可以得到一个新的列表,但是如果列表中含有列表,所有b, c, d, e四个新列表的子列表都是指引到同一个对象上。只有使用copy.deepcopy(a)方法得到的新列表f才是包括子列表在内的完全复制
所以,请注意你要copy的对象,有无子列表元素。如果有,请使用deepcopy