python 生成器generator
通过列表list生成器,我们可以直接创建一个列表
>>> x = list(range(1,11)) >>> x [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
但是,受到内存的限制,列表的容量是有限的,而且创建一个包含100万1个亿的列表时候,不仅会占用很大的储存空间,如果有事我们只要访问前面几个元素,那后面大多数元素都白白浪费了。而且运作效率低下。
如果列表元素可以按某种算法推算出来,那我们是否可以在循环的过程中不断推算出后面的元素呢?这样就不必要创建一个完整的list列表了,从而提升程序的效率。在python中,这种一边循环一边计算的机制,称为生成器generator
要创建一个generator,有很多方法:
第一种方法很简单,就是只要把一个列表生成试的 [ ] 改成 ( ) 就可以创建一个generator:
>>> l = [x * x for x in range(10)] >>> l [0, 1, 4, 9, 16, 25, 36, 49, 64, 81] >>> g = (x * x for x in range(10)) >>> g <generator object <genexpr> at 0x00000000035BC410>
L 是一个list, 而 G 是一个generator:它们在创建时候最基本的不同就list是 [ ] ,而generator是 ( ) 。
我们可以直接打印出list的全部元素,但是怎么打印出generator的全部元素呢?
>>> g <generator object <genexpr> at 0x00000000035BC410>
如果要一个个打印出来,可以通过next()函数来获得generator的下一个返回值。
>>> next(g) 0 >>> next(g) 1 >>> next(g) 4 >>> next(g) 9 >>> next(g) 16 >>> next(g) 25 >>> next(g) 36 >>> next(g) 49 >>> next(g) 64 >>> next(g) 81 >>> next(g) Traceback (most recent call last): File "<pyshell#18>", line 1, in <module> next(g) StopIteration
generator保存的是算法,每次调用 next(g)的时候才会计算 g 的下一个元素值,直到计算到最后一个元素,没有下一个元素时,会返回stopIteration的错误。
当然,上面这种不停调用next (g)这种方法实在是太繁琐了,正确的方法是使用for循环,因为generator也是一个可迭代对象:
>>> g = (x * x for x in range(10)) >>> for n in g: ... print(n) ... 0 1 4 9 16 25 36 49 64 81
我们创建一个generator之后,基本上不会调用next(),而是通过for循环来迭代他,并且不用关心StopIteration的错误
generator非常强大,如果推算的算法比较复杂,用类似列表生成试的for循环无法实现的时候,我还可以用函数来实现。