我们已经知道,可以直接作用于 for 循环的数据类型有以下几种:
- 一类是集合数据类型,如 list , tuple , dict , set ,str 等;
- 一类是 generator ,包括生成器和带 yield 的 generator function。
这些可以直接作用于 for 循环的对象统称为可迭代对象: Iterable 。
可以使用 isinstance() 判断一个对象是否是 Iterable 对象:
>>> Iterable <class 'collections.abc.Iterable'> >>> isinstance('abc',Iterable) #str 是可迭代类型 True >>> isinstance(100,Iterable) #int 不是可迭代类型 False
而生成器不但可以作用于for循环,还可以被next()函数不断调用并返回下一个值,直到最后抛出 StopIteration 错误表示无法继续进行,返回下一个值了。
- 可以被 next() 函数调用并不断返回下一个值的对象成为迭代器:Iterator。
可以使用 isinstance() 判断一个对象是否是 Iterator 对象。
>>> from collections import Iterator >>> isinstance( (x for x in range (10)),Iterator) True >>> isinstance( [],Iterator) False >>> isinstance( {},Iterator) False >>> isinstance('abc',Iterator) False
生成器都是 Iterable 对象,但 list、dict、str 虽然是 Iterable ,但都不是 Iterator。
把 list、dict、str 等 Iterable 变成 Iterator 可以使用 iter() 函数。
>>> isinstance(iter('abc'),Iterator) True >>> isinstance(iter([]),Iterator) True
你可能会问,为什么 list、dict、str 等数据类型不是 Iterator ?
这是因为Python的 Iterator 对象表示的是一个数据流,Iterator 对象可以被 next() 函数调用并不断返回下一个数据,直到没有数据时抛出 StopIteration 错误。可以把这个数据流看作是一个有序序列,但是我们却不能提前知道序列的长度,只能不断通过 next() 函数实现按需计算下一个数据,所以 Iterator 的计算是惰性的,只有在需要计算下一个数据时它才会计算。
Iterator 甚至可以表示一个无限大的数据流,例如全体自然数。而使用 list 时永远不可能存储全体自然数的。