深拷贝与浅拷贝
概述
本文涉及到主要的概念有:
- 变量(名)
- 引用
- 对象
- 可变对象和不可变对象
- 拷贝
- 深拷贝和拷贝
正文
像Java,Python这样的语言,存在着深拷贝,浅拷贝的问题。下面我们先通过一张图来看看变量和对象的关系:
变量和对象的关系
对象和变量
我们要明确以下概念:
- 变量 是系统变量名表中的元素(可以想象成人的名字)
- 对象 是计算机分配的一块内存,需要足够的空间去表示它的值(可以想象成真正的人)
- 引用 是 自动形成的从变量到对象的 指针(给人对象取人名变量名)
如果不清楚动态类型变量的概念,可以看一下下面的总结:
- Python的变量创建过程是在代码第一次给他赋值就创建了变量,之后的赋值 会改变已经创建的变量名的值
- Python的变量是没有类型的,变量是通用的,只是在一个特定的时间点,引用了一个特定的对象
- Python中 使用变量的时候,当变量出现在表达式中时,它会马上被所引用的对象所替代。当然,使用没赋值的变量会产生错误
在Python中,对象按照可变不可变分为可变对象和不可变对象:
可变对象 指 可以在原处修改,而不用创建新的对象(包括列表,字典,集合);
不可变对象指 不支持在原处修改,只能通过表达式创建新的对象,然后把结果分配给变量(包括 数字,字符串,元组)。
像a = 3
,这段代码的执行过程是这样:
- 创建一个对象表示3
- 创建一个变量a, 如果它还没有创建的话
- 将变量与新的对象连接
因为这样的特性,如果两个对象同时指向一个可变对象,可能会有不期望的结果:
In [1]: a = [1, 2, 3, 4]
In [2]: b = a
In [3]: a[0] = 0
In [4]: a
Out[4]: [0, 2, 3, 4]
In [5]: b
Out[5]: [0, 2, 3, 4]
拷贝:
在业务中有时我们需要复制一个对象,但是又不想对原对象产生副作用,那就不能通过赋值给新变量来解决了(赋值不是拷贝一个对象)。Python专门提供了一种拷贝机制,基于原对象创建一个含有相同值的对象。拷贝有copy
模块提供。
拷贝分成浅拷贝和深拷贝。
浅拷贝包括:
- 对列表切片拷贝
L[:]
- 调用对象的拷贝方法:
list.copy()
- 调用
copy.copy()
深拷贝包括:
- 调用
copy.deepcopy()
那么,浅拷贝和深拷贝有什么异同呢?两种拷贝的异同可以用下表描述:
两种拷贝的异同
来看一段代码体会一下:
In [6]: x = [1, 2]
In [7]: y = [3, 4]
In [8]: z = [x, y]
In [10]: a = copy.copy(z)
In [12]: a[0] is z[0]
Out[12]: True
In [13]: b = copy.deepcopy(z)
In [14]: b[0] is z[0]
Out[14]: False
解释:
浅拷贝拷贝出来的a对象是引用x和y,当修改x或y的值时,a也会改变;
深拷贝会把里面的元素也重新拷贝一份,拷贝了一份x和y的值相等的两个元素,修改x和y的值,不会对b产生影响。
走在从入门到放弃,最终删库跑路的路上