迭代器

一、简述

  我们经常使用for循环去遍历一些序列数据,但是我们有的时间发现for循环的效率很低,而且很占用了大量的硬件资源,但是有的for循环遍历效率很高,而且很节省硬件资源,这是为什么呢?有人说是生成器的原因。

二、可迭代对象

1、for循环数据类型

  • 集合数据类型,如:list、tuple、dict、set、str、bytes(字节)等。
  • 生成器(generator),包括生成器和带yield的生成器函数。

2、定义

  可迭代对象(Iterable):直接用于for循环遍历数据的对象

3、用isinstance()方法判断一个对象是否是Iterable对象

from  collections import  Iterable
print(isinstance([],Iterable)) #列表
True

print(isinstance((),Iterable))  #元组
True

print(isinstance({},Iterable))   #字典
True

print(isinstance("abc",Iterable))  #字符串
True

print(isinstance(100,Iterable))   #整型
False

 注:生成器不但可以作用于for循环,还可以被__next__()函数不断调用,并且返回下一个值,直到最后抛出StopIteration错误表示无法继续返回下一个值而抛出的异常。

三、迭代器

1、定义

  迭代器(Iterator):可以用__next__()函数调用并不断的返回下一个值的对象称为迭代器。

2、用isinstance()方法判断一个对象是否是Iterator对象

from  collections  import Iterator

print( isinstance((i*2 for i in range(5)),Iterator) ) #生成器
True

print( isinstance([],Iterator)) #列表
False

print( isinstance({},Iterator)) #字典
False

print( isinstance("abc",Iterator)) #字符串
False

通过上面的例子可以看出,生成器都是Iterator对象,但是list、dict、str虽然是Iterable对象,却不是Iterator对象。

3、iter()函数

功能:把list、dict、str等Iterable对象变成Iterator对象。

from  collections  import Iterator

print( isinstance(iter([]),Iterator)) #列表
True

print( isinstance(iter({}),Iterator)) #字典
True

4、为什么list、dict、str等数据类型不是Iterator?

  这是因为python的Iterator对象表示的是一个数据流,Iterator对象可以被__next__()函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过__next__()函数实现按需计算下一个数据,所以Iterator的计算是惰性的,只有在需要返回下一个数据时才会计算。

注:Iterator甚至可以表示一个无限大的数据流,例如:全体自然数。而使用list是永远不可能存储全体自然数的。

四、rang()方法

在python2.7和python3的range()方法实现的原理是不一样的,下面我们就来用代码看看,代码如下:

>>> range(5)  #python2.7
[0, 1, 2, 3, 4]
>>> xrange(5) #python2.7
xrange(5)
>>> range(5)  #python3.5
range(0, 5)

从上面的代码可以看出,在python2.7中rang()只是一个list,在python3中是一个迭代器,python2.7中xrange()跟python3中的range()功能是一样的。

python3中的range()方法实现的原理如下:

for x in range(5):
    pass

实际相当于:

# 首先获得Iterator对象:
it = iter([1, 2, 3, 4, 5])
# 循环:
while True:
    try:
        # 获得下一个值:
        x = next(it)
    except StopIteration:
        # 遇到StopIteration就退出循环
        break

 五、总结

  1. 凡是可以作用于for循环的对象都是Iterable类型。
  2. 凡是作用于__next__()函数的对象都是Iterator类型,它们表示一个惰性计算的序列。
  3. 集合数据类型,例如:list、dict、str等,是Iterable但是不是Iterator
  4. 集合数据类型可以通过iter()函数获得一个Iterator对象。
posted @ 2017-08-18 16:51  七天&七天  阅读(157)  评论(0编辑  收藏  举报