可以直接用for循环的数据类型有:
- 集合数据类型,如:list、tuple、dict、set、str等;
- 生成器generator,包括生成器和带yield的generator function。
以上这些可以直接使用for循环的对象统称为可迭代对象:Iterable.
可以使用isinstance()函数来判断一个对象是不是Iterable对象:
>>> from collections import Iterable >>> isinstance([],Iterable) True >>> isinstance({},Iterable) True >>> isinstance('zyx',Iterable) True >>> isinstance((x for x in range(10)),Iterable) True >>> isinstance(100,Iterable) False
又生成器不但可以使用for循环,还可以被next()函数不断调用并返回下一个值,直到最后抛出StopIteration错误。可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator.
可以使用isinstance()判断一个对象是不是Iterator:
>>> from collections import Iterator >>> isinstance([],Iterator) False >>> isinstance({},Iterator) False >>> isinstance('xyz',Iterator) False >>> isinstance((x for x in range(10)),Iterator) True
注意:生成器都是Iterator对象,但是list、set、str、虽然是Iterable,却不是Iterator.
把list、dict、str、等Iterable对象变成Iterator对象可以使用iter()函数:
>>> isinstance(iter([]),Iterator) True >>> isinstance(iter('abc'),Iterator) True
问题来了:为什么list、dict、str数据类型不是Iterator呢?
这是因为python中的Iterator迭代器对象表示的是一个数据流,Iterator对象可以被next()调用并不断返回下一个值,知道抛出StopIteration错误。可以把这个数据流看作是一个有序序列,但我们却不知道序列的长度,只能不断的通过next()函数按需去计算下一个数据,我们称Iterator的计算是惰性的,只有在需要返回下一个数据的时候它才会计算。Iterator甚至可以表示一个无限大的数据流,例如正偶数。而使用list是永远不能存储全体正偶数的。
总结:
- 凡是可以使用for循环的对象都是Iterable类型;
- 凡是可以使用next()函数的对象都是Iterator类型,表示一个惰性计算的序列
- 集合数据类型例如list、dict、str等是Iterable却不是Iterator,可以通过iter()函数获得一个Iterator对象。
- python的for循环实质上就是通过不断的调用next()函数实现的。
笑声激发自强,发愤、图强、飞身向上