菜鸟学飞自学Python(四)生成器、迭代器
(仅个人学习摘抄)
列表生成式
列表生成式即 List Comprehensions,是 Python 内置的非常简单却强大的可以用来创建 list 的生成式。
生成简单的 list [1,2,3,4,5,6,7,8,9,10] 可以用 list(range(1,11)) :
如果生成复杂的 list[1x1,2x2,3x3,...,10x10] 如何实现,可以利用循环:
但是循环太繁琐,用列表生成式仅一行语句就可以完成:
写列表生成式时,把要生成的元素 x * x 放到前面,后面跟 for 循环,就可以把 list 创建出来。
for 循环后面还可以加上 if 判断,我们可以筛选出仅偶数的平方:
可以利用两层循环,生成全排列:
列出当前目录下的所有文件和目录名:
for 循环其实可以同时使用两个甚至多个变量,比如 dict 的 item() 可以同时迭代 key 和 value:
因此,列表生成式也可以使用两个变量来生成 list:
把 list 中所有的字符串变成小写:
练习
使用内建的 isinstance 函数可以判断一个变量是不是字符串:
生成器
通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表的容量肯定是有限的。所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的 list,从而节省大量的空间。
在 Python 中,一边循环一边计算的机制,称为生成器:generator。
创建 generator:
把一个列表生成式的 [] 改成 ()
创建 L 和 g 的区别仅在于最外层的 [] 和 (),L 是一个 list,而 g 是一个 generator。
打印出 generator 的元素:
1、next() 函数
一个一个打印,获得 generator 的下一个返回值:
generator 保存的是算法,每次调用 next(g),就计算出 g 的下一个元素值,直到计算到最后一个元素,没有更多的元素时,抛出 StopTteration 的错误。
2、for 循环
generator 也是可迭代对象
基本都使用 for 循环迭代,并且不需要关心 StopIteration 错误。
generator 非常强大,如果推算的算法比较复杂,用类似列表生成式的 for 循环无法实现的时候,还可以用函数来实现。
例如,斐波拉契数列(Fibonacci),除第一个和第二个数外,任意一个数都可由前两个数相加得到:
1,1,2,3,5,8,13,21,34,...
斐波拉契数列用列表生成式写不出来,但是用函数打印出来很容易:
把 fib 函数变成 generator,只需把 print(b) 改成 yield b 就可以了:
如果一个函数定义中包含 yield 关键字,这个函数就是一个 generator。
generator 和函数的执行流程不一样。函数是顺序执行,遇到 return 语句或者最后一行函数语句就返回。generator 函数,在每次调用 next() 的时候执行,遇到 yield 语句返回,再次执行时从上次返回的 yield 语句处继续执行。
例子:
定义一个 generator,依次返回数字 1,3,5:
调用该 generator 时,首先要生成一个 generator 对象,然后用 next() 函数不断获得下一个返回值:
可以看到,odd 不是普通函数,而是 generator,在执行过程中,遇到 yield 就中断,下次又继续执行。
在 fib 的例子中,我们在循环过程中不断调用 yield,就不会中断。所以要给循环设置一个条件来退出循环,不然就会产生一个无线数列出来。
把函数改为 generator 后,基本不会用 next() 来获取下一个返回值,而是直接使用 for 循环迭代。但是用 for 循环调用 generator 时,发现拿不到 generator 的 return 语句的返回值。如果想要拿到返回值,必须捕获 StopIteration 错误,返回值包含在 StopIteration 的 value 中:
练习:
杨辉三角形
generator.py
迭代器
可以直接作用于 for 循环的对象统称为可迭代对象:Iterable。可以使用 isinstance() 判断一个对象是否是 Iterable 对象。
生成器 generator 可以作用于 for 循环,还可以被 next() 函数不断调用并返回下一个值,直到最后抛出 StopIteration 错误表示无法继续返回下一个值。但是,可以被 next() 函数调用并不断返回下一个值的对象称为迭代器:Iterator。
生成器都是 Iterator 对象,但 list、dict、str 虽然是 Iteratable,却不是 Iterator。把 list、dict、str 等 Iterable 变成 Iterator 可以使用 iter() 函数:
Python 的 Iterator 对象表示的是一个数据流,Iterator 对象可以被 next() 函数调用并不断返回下一个数据,直到没有数据时抛出 StopIteration 错误。可以把这个数据流看作是一个有序序列,但我们不能提前知道序列的长度,只能不断通过 next() 函数实现按需计算下一个数据,所以 Iterator 的计算是惰性的,只有在需要返回下一个数据时它才会计算。Iterator 甚至可以表示一个无限大的数据流,例如全体自然数。而 使用 list 永远不可能存储全体自然数。