python—深浅copy
python的变量及其存储
在高级语言中,变量是对内存及其地址的抽象。对于python而言,python的一切变量都是对象,变量的存储,采用了引用语义的方式,存储的只是一个变量的值所在的内存地址,而不是这个变量的只本身。
引用语义:在python中,变量保存的是对象(值)的引用,我们称为引用语义。采用这种方式,变量所需的存储空间大小一致,因为变量只是保存了一个引用。也被称为对象语义和指针语义。 值语义:有些语言采用的不是这种方式,它们把变量的值直接保存在变量的存储区里,这种方式被我们称为值语义,例如C语言,采用这种存储方式,每一个变量在内存中所占的空间就要根据变量实际的大小而定,无法固定下来。 值语义和引用语义的区别: 值语义: 死的、 傻的、 简单的、 具体的、 可复制的 引用语义: 活的、 聪明的、 复杂的、 抽象的、 不可复制的
下面是python的引用语义和c语言值语义在内存的存储情况:
基本数据类型的地址存储及改变情况
在python中的数据类型包括:bool、int、long、float、str、set、list、tuple、dict等等。我们可以大致将这些数据类型归类为简单数据类型和复杂的数据结构。
由于python中的变量都是采用的引用语义,数据结构可以包含基础数据类型,导致了在python中数据的存储是下图这种情况,每个变量中都存储了这个变量的地址,而不是值本身;对于复杂的数据结构来说,里面的存储的也只只是每个元素的地址而已。:
1.数据类型重新初始化对python语义引用的影响
变量的每一次初始化,都开辟了一个新的空间,将新内容的地址赋值给变量。对于下图来说,我们重复的给str1赋值,其实在内存中的变化如下右图:
从上图可以看出,存储变量的地址变成了新的,旧的地址被python定时清空。
2.数据结构内部元素变化重对python语义引用的影响
当对列表中的元素进行一些增删改的操作的时候,是不会影响到n1列表本身对于整个列表地址的,只会改变其内部元素的地址引用。可是当我们对于一个列表重新初始化(赋值)的时候,就给n1这个变量重新赋予了一个地址,覆盖了原本列表的地址,这个时候,n1列表的内存id就发生了改变。上面这个道理用在所有复杂的数据类型中都是一样的。
变量的赋值
1.str的赋值
2.复杂的数据结构中的赋值
对列表的增加修改操作,没有改变列表的内存地址,lst1和lst2都发生了变化
copy
对于复杂的数据结构来说,赋值就等于完全共享了资源,一个值的改变会完全被另一个值共享。然而有的时候,我们需要将一份数据的原始内容保留一份,再去处理数据,这个时候使用赋值就不够明智了。python为这种需求提供了copy模块。提供了两种主要的copy方法,一种是普通的copy,另一种是deepcopy。我们称前者是浅拷贝,后者为深拷贝。
浅copy
目的是为了两个变量用同一个地址
深拷贝
深拷贝就是在内存中重新开辟一块空间,不管数据结构多么复杂,只要遇到可能发生改变的数据类型,就重新开辟一块内存空间把内容复制下来,直到最后一层,不再有复杂的数据类型,就保持其原引用。这样,不管数据结构多么的复杂,数据之间的修改都不会相互影响。这就是深拷贝,深copy需要引入工具箱
import copy
copy.deepcopy()
深copy:同一个变量用两个不同的地址来存放