python学习笔记十五-生成器
在 Python 中,使用了 yield 的函数被称为生成器(generator)。
跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器。
在调用生成器运行的过程中,每次遇到 yield 时函数会暂停并保存当前所有的运行信息,返回 yield 的值, 并在下一次执行 next() 方法时从当前位置继续运行。
调用一个生成器函数,返回的是一个迭代器对象。
以下实例使用 yield 实现斐波那契数列:
#!/usr/bin/python3 import sys def fibonacci(n): # 生成器函数 - 斐波那契 a, b, counter = 0, 1, 0 while True: if (counter > n): return yield a a, b = b, a + b counter += 1 f = fibonacci(10) # f 是一个迭代器,由生成器返回生成 while True: try: print (next(f), end=" ") except StopIteration: sys.exit() 执行以上程序,输出结果如下: 0 1 1 2 3 5 8 13 21 34 55
后记:
来看一下有yield和没有yield的情况会对生成器了解多点:
第一种:使用 yield
#!/usr/bin/python3 import sys def fibonacci(n,w=0): # 生成器函数 - 斐波那契 a, b, counter = 0, 1, 0 while True: if (counter > n): return yield a a, b = b, a + b print('%d,%d' % (a,b)) counter += 1 f = fibonacci(10,0) # f 是一个迭代器,由生成器返回生成 while True: try: print (next(f), end=" ") except : sys.exit() 输出结构: 0 1,1 1 1,2 1 2,3 2 3,5 3 5,8 5 8,13 8 13,21 13 21,34 21 34,55 34 55,89 55 89,144
第二种:不使用 yield
#!/usr/bin/python3 import sys def fibonacci(n,w=0): # 生成器函数 - 斐波那契 a, b, counter = 0, 1, 0 while True: if (counter > n): return #yield a a, b = b, a + b print('%d,%d' % (a,b)) counter += 1 f = fibonacci(10,0) # f 是一个迭代器,由生成器返回生成 while True: try: print (next(f), end=" ") except : sys.exit() 输出结果: 1,1 1,2 2,3 3,5 5,8 8,13 13,21 21,34 34,55 55,89 89,144
第二种没有yield时,函数只是简单执行,没有返回迭代器f。这里的迭代器可以用生成l列表来理解一下:
>>> l = [i for i in range(0,15)] >>> print(l) [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14] >>> m = (i for i in range(0,15)) >>> print(m) <generator object <genexpr> at 0x104b6f258> >>> for g in m: ... print(g,end=', ') ... 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14,
这里的m就像上面的f一样,是迭代器。
什么情况下需要使用 yield?
一个函数 f,f 返回一个 list,这个 list 是动态计算出来的(不管是数学上的计算还是逻辑上的读取格式化),并且这个 list 会很大(无论是固定很大还是随着输入参数的增大而增大),这个时候,我们希望每次调用这个函数并使用迭代器进行循环的时候一个一个的得到每个 list 元素而不是直接得到一个完整的 list 来节省内存,这个时候 yield 就很有用。
具体怎么使用 yield 参考:Python yield 使用浅析
以斐波那契函数为例,我们一般希望从 n 返回一个 n 个数的 list:
def fab(max): n, a, b = 0, 0, 1 L = [] while n < max: L.append(b) a, b = b, a + b n = n + 1 return L
上面那个 fab 函数从参数 max 返回一个有 max 个元素的 list,当这个 max 很大的时候,会非常的占用内存。
一般我们使用的时候都是这个样子的,比如:
f = iter(fab(1000)) while True: try: print (next(f), end=" ") except StopIteration: sys.exit()
这样我们实际上是先生成了一个 1000 个元素的 list:f,然后我们再去使用这个 f。
现在,我们换一个方法:
因为我们实际使用的是 list 的遍历,也就是 list 的迭代器。那么我们可以让这个函数 fab 每次只返回一个迭代器——一个计算结果,而不是一个完整的 list:
def fab(max): n, a, b = 0, 0, 1 while n < max: yield b # print b a, b = b, a + b n = n + 1
这样,我们每次调用fab函数,比如这样:
for x in fab(1000): print(x)
或者 next 函数之类的,实际上的运行方式是每次的调用都在 yield 处中断并返回一个结果,然后再次调用的时候再恢复中断继续运行。
对yield的测试结果:
- 打个比方的话,yield有点像断点。 加了yield的函数,每次执行到有yield的时候,会返回yield后面的值 并且函数会暂停,直到下次调用或迭代终止;
- yield后面可以加多个数值(可以是任意类型),但返回的值是元组类型的。
def get(): m = 0 n = 2 l = ['s',1,3] k = {1:1,2:2} p = ('2','s','t') while True: m += 1 yield m yield m ,n ,l ,k ,p it = get() print(next(it)) #1 print(next(it)) #(1, 2, ['s', 1, 3], {1: 1, 2: 2}, ('2', 's', 't')) print(next(it)) #2 print(type(next(it))) #<class 'tuple'>
def get(): m = 0 n = 2 l = ['s',1,3] k = {1:1,2:2} p = ('2','s','t') while True: m += 1 yield m yield m ,n ,l ,k ,p it = get() print(next(it)) #1 print(next(it)) #(1, 2, ['s', 1, 3], {1: 1, 2: 2}, ('2', 's', 't')) print(next(it)) #2 print(type(next(it))) #<class 'tuple'>
如果再加一句:
print(type(next(it))) #<class 'int'> #返回的是整形
所以返回值的类型,应该是当前调用时,yield 返回值的类型。
看下面实例更便于理解
def myYield_1(): a, i = 'yield', 0 while True: print('before #%d' % i, end=", ") yield a, i print('after #%d' % i, end=", ") i += 1 def myYield_2(): a, i = 'yield_a', 0 b, i = 'yield_b', 0 while True: print('before #%d' % i, end=", ") yield a, i yield b, i print('after #%d' % i, end=", ") i += 1 it1 = iter(myYield_1()) it2 = iter(myYield_2()) for i in range(10): print("next #%d" % i, end=": ") print(next(it1)) print('\n') for i in range(10): print("next #%d" % i, end=": ") print(next(it2))
输出是这样的:
next #0: before #0, ('yield', 0) next #1: after #0, before #1, ('yield', 1) next #2: after #1, before #2, ('yield', 2) next #3: after #2, before #3, ('yield', 3) next #4: after #3, before #4, ('yield', 4) next #5: after #4, before #5, ('yield', 5) next #6: after #5, before #6, ('yield', 6) next #7: after #6, before #7, ('yield', 7) next #8: after #7, before #8, ('yield', 8) next #9: after #8, before #9, ('yield', 9) next #0: before #0, ('yield_a', 0) next #1: ('yield_b', 0) next #2: after #0, before #1, ('yield_a', 1) next #3: ('yield_b', 1) next #4: after #1, before #2, ('yield_a', 2) next #5: ('yield_b', 2) next #6: after #2, before #3, ('yield_a', 3) next #7: ('yield_b', 3) next #8: after #3, before #4, ('yield_a', 4) next #9: ('yield_b', 4)