Python的高级特性1:容易忽略的不可变类型
python中有一些容易忽略的不可变类型(str,integer,tuple,None)
#错误演示
In [45]: def demo(lst=[]): ....: lst.append("hello") ....: return lst ....: In [46]: demo() Out[46]: ['hello'] In [47]: demo() Out[47]: ['hello', 'hello']
廖雪峰的python教程有提到这一块,但并没有太细致。在这里,由于lst是一个可变参数,而demo在初始化时lst参数指向一个[]的内存空间,之后每一次调用,[]这个内存空间都append一个“hello”,而由于lst依然指向这个内存空间,所以就会看到demo函数调用的奇怪现象,解决问题的办法就是引入不可变类型。
#正确演示 In [54]: def demo(lst=None): ....: lst=[] ....: lst.append("hello") ....: return lst ....: In [55]: demo() Out[55]: ['hello'] In [56]: demo() Out[56]: ['hello']
在正确演示中,将lst初始化为None,这样lst就是一个不可变参数,但是不能直接对lst直接使用append,因为只有list才有append方法,因此需要将lst进行真正的初始化:lst=[]
可变类型和不可变类型是一个很容易忽略的知识点,在这里深入进行研究,下面例举常见的不可变类型和可变类型。
- 不可变(mutable)类型:int, long, float, string, tuple, frozenset
- 可变类型(immutable)类型:list, dict
Python中所有变量都是值的引用,也就说变量通过绑定的方式指向其值。 而这里说的不可变指的是值的不可变。 对于不可变类型的变量,如果要更改变量,则会创建一个新值,把变量绑定到新值上,而旧值如果没有被引用就等待垃圾回收。下面用int和list分别作为代表进行讲解。
#不可变类型 In [31]: id(1),id(2) Out[31]: (4477999936, 4477999968) In [32]: a = 1 In [33]: id(a) Out[33]: 4477999936 In [34]: #当a赋一个新值时,变量a会绑定到新值上 In [35]: a = 3 In [36]: id(a) Out[36]: 4478000000 #可变类型 In [38]: lst = [0] In [39]: id(lst) Out[39]: 4493976328 In [40]: lst = [0,1] In [41]: id(lst) Out[41]: 4499600328
ps:表面上看可变类型,python似乎实现了不同类型的管理方式,其实不是的。其实lst代表地址,它引用的lst[0],lst[1]的内存地址其实是变了的,因为lst[i]就是int(此处),而int就是不可变类型。
另外,我还想延伸一下关于__new__的用法。为什么要放在这里说,待会看了这个例子就会明白。
class Word(str): def __new__(cls, word): word = word.replace(" ","") return str.__new__(cls,word) def __init__(self,word): self.word = word
def __eq__(self, other): return len(self)==len(other)
def main(): a=Word("foorrrdd ") b=Word("sswwss ") print a==b
if __name__ == '__main__': main()
在这段代码里,可以看到Word类继承自str,str是一个不可变类型,因此需要使用到__new__这个魔术方法,在这里对word这个形参进行了预处理,然后预处理后的形参word会传递给__init__。由于此例此种情形中,a,b指向的是不同的内存空间,即使不用__new__也不会因为实参的传入导致上面例子出现不断追加的情况,但显然这会是一种更为安全的写法。
(ps:我不是很确定None是不是一个不可变类型,这篇文章只是个人的理解,如果有误,恳请指正。)