Python闭包与延迟绑定
Python闭包
1.什么是闭包,闭包必须满足以下3个条件:
- 必须有一个内嵌函数
- 内嵌函数必须应用外部函数的变量
- 外部函数的返回值必须是内嵌函数
举个栗子
# 嵌套函数但不是闭包
def nested():
def nst():
print('i am nested func %s' % nested.__name__)
nst()
# 闭包函数
def closure():
var = 'hello world' # 非全局局部变量
def cloe():
print(var) # 引用var
return cloe # 返回内部函数
cl = closure()
cl()
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
2.闭包优点
- 避免使用全局变量
- 可以提供部分数据的隐藏
- 可以提供更优雅的面向对象实现
优点1,2 就不说了,很容易理解,关于第三个,例如当在一个类中实现的方法很少时,或者仅有一个方法时,就可以选择使用闭包。
举个栗子
# 用类实现一个加法的类是这样
class _Add(object):
def __init__(self, a, b):
self.a = a
self.b = b
def add(self):
return self.a + self.b
# 用闭包实现
def _Add(a):
def add(b):
return a + b
return add
ad = _Add(1) # 是不是很像类的实例化
print(ad(1)) # out:2
print(ad(2)) # out:3
print(ad(3)) # out:4
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
闭包的概念差不多就是这样了。
Python 延迟绑定
结合一个题目来说明:
def multipliers():
return [lambda x : i*x for i in range(4)]
print [m(2) for m in multipliers()]
output:
# [6, 6, 6, 6]
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
其实这个题目,可能目的是想输出:[0, 2, 4, 6],如何改进才能输出这个结果呢?
def multipliers():
# 添加了一个默认参数i=i
return [lambda x, i=i: i*x for i in range(4)]
print [m(2) for m in multipliers()]
output:
# [0, 2, 4, 6]
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
multipliers就是一个闭包函数了
1.def multipliers():
2. return [lambda x : i*x for i in range(4)]
3. # multipliers内嵌套一个匿名函数
4. # 该匿名函数引用外部非全局变量 i
5. # 返回该嵌套函数
6.print [m(2) for m in multipliers()]
- 1
- 2
- 3
- 4
- 5
- 6
下面来解释为什么输出结果是[6,6,6,6]。
运行代码,代码从第6行开始运行,解释器碰到了一个列表解析,循环取multipliers()函数中的值,而multipliers()函数返回的是一个列表对象,这个列表中有4个元素,每个元素都是一个匿名函数(实际上说是4个匿名函数也不完全准确,其实是4个匿名函数计算后的值,因为后面for i 的循环不光循环了4次,同时提还提供了i的变量引用,等待4次循环结束后,i指向一个值i=3,这个时候,匿名函数才开始引用i=3,计算结果。所以就会出现[6,6,6,6],因为匿名函数中的i并不是立即引用后面循环中的i值的,而是在运行嵌套函数的时候,才会查找i的值,这个特性也就是延迟绑定)
# 为了便于理解,你可以想象下multipliers内部是这样的(这个是伪代码,并不是准确的):
def multipliers():
return [lambda x: 3 * x, lambda x: 3 * x, lambda x: 3 * x, lambda x: 3 * x]
- 1
- 2
- 3
- 4
因为Python解释器,遇到lambda(类似于def),只是定义了一个匿名函数对象,并保存在内存中,只有等到调用这个匿名函数的时候,才会运行内部的表达式,而for i in range(4) 是另外一个表达式,需等待这个表达式运行结束后,才会开始运行lambda 函数,此时的i 指向3,x指向2
那我们来看下,添加了一个i=i,到底发生了什么?
def multipliers():
# 添加了一个默认参数i=i
return [lambda x, i=i: i*x for i in range(4)]
- 1
- 2
- 3
添加了一个i=i后,就给匿名函数,添加了一个默认参数,而python函数中的默认参数,是在python 解释器遇到def(i=i)或lambda 关键字时,就必须初始化默认参数,此时for i in range(4),每循环一次,匿名函数的默认参数i,就需要找一次i的引用,i=0时,第一个匿名函数的默认参数值就是0,i=1时,第二个匿名函数的默认参数值就是1,以此类推。
# 为了便于理解,你可以想象下multipliers内部是这样的(这个是伪代码只是为了理解):
def multipliers():
return [lambda x,i=0: i*x, lambda x,i=1: i*x, lambda x,i=2: i*x, lambda x,i=3:i*x i=3]
# x的引用是2 所以output的结果就是:[0,2,4,6]
- 1
- 2
- 3
- 4
- 5
当然你的i=i,也可以改成a=i。
def multipliers():
return [lambda x,a=i: a * x for i in range(4)]
- 1
- 2
Python的延迟绑定其实就是只有当运行嵌套函数的时候,才会引用外部变量i,不运行的时候,并不是会去找i的值,这个就是第一个函数,为什么输出的结果是[6,6,6,6]的原因。