可迭代对象(Iterable)
这些可以直接作用于for
循环的对象统称为可迭代对象:Iterable
。
我们已经知道,可以直接作用于for
循环的数据类型有以下几种:
- 一类是集合数据类型,如
list
、tuple
、dict
、set
、str
等; - 一类是
generator
,包括生成器和带yield
的generator function。
可以使用isinstance()
判断一个对象是否是Iterable
对象:
from collections import Iterable isinstance([], Iterable)
生成器(generator )
生成器不但可以作用于for
循环,还可以被next()
函数不断调用并返回下一个值,直到最后抛出StopIteration
错误表示无法继续返回下一个值了。
创建一个generator:
- 第一种方法很简单,只要把一个列表生成式的
[]
改成()
,就创建了一个generator;
L = [x * x for x in range(10)] #<generator object <genexpr> at 0x1022ef630> g = (x * x for x in range(10))
- 如果一个函数定义中包含
yield
关键字,那么这个函数就不再是一个普通函数,而是一个generator:最难理解的就是generator和函数的执行流程不一样。函数是顺序执行,遇到return
语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()
的时候执行,遇到yield
语句返回,再次执行时从上次返回的yield
语句处继续执行。 - 生成器都是Iterator对象;
迭代器(Iterator)
凡是可作用于next()
函数的对象都是Iterator
类型,它们表示一个惰性计算的序列;
- 集合数据类型如
list
、dict
、str
等是Iterable
但不是Iterator
,不过可以通过iter()
函数获得一个Iterator
对象。
isinstance(iter([]), Iterator) #True isinstance([], Iterator) #False
- Iterator本质是一个:长度未知的抽象数据流(也可能是无限长),在需要返回下一个数据时调用next( )得到;
- 为什么
list
、dict
、str
等数据类型不是Iterator
? 这是因为Python的Iterator
对象表示的是一个数据流,Iterator对象可以被next()
函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration
错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()
函数实现按需计算下一个数据,所以Iterator
的计算是惰性的,只有在需要返回下一个数据时它才会计算。
#Python的for
循环本质上就是通过不断调用next()
函数实现的。