Python入门之python可变对象与不可变对象
本文分为如下几个部分
- 概念
- 地址问题
- 作为函数参数
- 可变参数在类中使用
- 函数默认参数
- 类的实现上的差异
概念
可变对象与不可变对象的区别在于对象本身是否可变。
python内置的一些类型中
- 可变对象:list dict set
- 不可变对象:tuple string int float bool
举一个例子
# 可变对象 >>> a = [1, 2, 3] >>> a[1] = 4 >>> a [1, 4, 3] # 不可变对象 >>> b = (1, 2, 3) >>> b[1] = 4 Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: 'tuple' object does not support item assignment
上面例子很直观地展现了,可变对象是可以直接被改变的,而不可变对象则不可以。
地址问题
下面我们来看一下可变对象的内存地址变化
>>> a = [1, 2, 3] >>> id(a) 2139167175368 >>> a[1] = 4 >>> id(a) 2139167175368
我们可以看到,可变对象变化后,地址是没有改变的
如果两个变量同时指向一个地址
1.可变对象
>>> a = [1, 2, 3] >>> id(a) 2139167246856 >>> b = a >>> id(b) 2139167246856 >>> a[1] = 4 >>> a [1, 4, 3] >>> b [1, 4, 3] >>> id(a) 2139167246856 >>> id(b) 2139167246856
我们可以看到,改变a
则b
也跟着变,因为他们始终指向同一个地址
2.不可变对象
>>> a = (1, 2, 3) >>> id(a) 2139167074776 >>> b = a >>> a = (4, 5, 6) >>> a (4, 5, 6) >>> b (1, 2, 3) >>> id(a) 2139167075928 >>> id(b) 2139167074776
我们可以看到,a
改变后,它的地址也发生了变化,而b
则维持原来的地址,原来地址中的内容也没有发生变化。
作为函数参数
1.可变对象
>>> def myfunc(l): ... l.append(1) ... print(l) ... >>> l = [1, 2, 3] >>> myfunc(l) [1, 2, 3, 1] >>> l [1, 2, 3, 1]
我们可以看到,可变对象作为参数传入时,在函数中对其本身进行修改,是会影响到全局中的这个变量值的,因为函数直接对该地址的值进行了修改。
2.不可变对象
>>> def myfunc(a): ... a += 1 ... print(a) ... >>> a = 2 >>> myfunc(a) 3 >>> a 2
对于不可变对象来说,虽然函数中的a
值变了,但是全局中的a
值没变,因为函数中的a
值已经对应了另外一个地址,而全局中的a
值指向的原来地址的值是没有变的。
3.总结
python中向函数传递参数只能是引用传递,表示把它的地址都传进去了,这才会带来上面的现象。
有的编程语言允许值传递,即只是把值传进去,在里面另外找一个地址来放,这样就不会影响全局中的变量。
可变参数在类中使用
我们直接来看下面这个例子
class Myclass: def __init__(self, a): self.a = a def printa(self): print(self.a)
运行如下
>>> aa = [1,2] >>> my = Myclass(aa) >>> my.printa() [1, 2] >>> aa.append(3) >>> my.printa() [1, 2, 3]
我们可以看到,类中的变量和全局变量地址依然是共用的,无论在哪里修改都会影响对方。
其实这个特性也不能说是一个弊端,利用这一点可以进行一些很方便的操作,比如两个线程同时操作一个队列,我们不用设置一个global
队列,只要将队列这个可变对象传入类之中,修改就会自动同步。
下面这个生产者消费者例子就是这样
import time import threading import random from queue import Queue class Producer(threading.Thread): def __init__(self, queue): threading.Thread.__init__(self) self.queue = queue def run(self): while True: random_integer = random.randint(0, 100) self.queue.put(random_integer) print('add {}'.format(random_integer)) time.sleep(random.random()) class Consumer(threading.Thread): def __init__(self, queue): threading.Thread.__init__(self) self.queue = queue def run(self): while True: get_integer = self.queue.get() print('lose {}'.format(get_integer)) time.sleep(random.random()) def main(): queue = Queue() th1 = Producer(queue) th2 = Consumer(queue) th1.start() th2.start() if __name__ == '__main__': main()
将queue
传入两个类中,在两个类中随意更改,自动在两个类间同步。
函数默认参数
函数默认参数一定要设定为不可变参数,否则会引发一些错误,我们来看下面一个例子
>>> def myfunc(l=[]): ... l.append('add') ... print(l) ... >>> myfunc([1, 2, 3]) [1, 2, 3, 'add'] >>> myfunc(['a', 'b']) ['a', 'b', 'add']
上面代码是正常运行的,我们来看下面这些
>>> myfunc() ['add'] >>> myfunc() ['add', 'add'] >>> myfunc() ['add', 'add', 'add']
按理说应该每次都是['add']
,但是现在出现了意想不到的错误。
这是因为l = []
是在函数定义时就确定下来的了,所以之后每次调用这个函数,使用的l
都是同一个,如果不指定这个参数的新值,就会出现上面这个问题。
上面这个l
可以默认设置为None
,这就是一个不可变对象。
类的实现上的差异
其实list tuple里的这些元素都相当于类的属性,修改他们相当于修改类的属性。
正常定义一个类它的属性是可以正常访问和修改的,所以那些类的实例都是可变对象。
我们只要定义一个类,不允许它修改属性,就可以创建一个不可变对象。
这就要使用python的魔法方法,主要有两种方法
- 设置
__setattr__
直接抛出异常,即只要想设置属性值,就会抛出异常 - 设置
__slot__
限制属性的访问,如果属性都不能访问了,那就肯定不能修改
更细节的实现可以参考stackoverflow上的回答