9、Python之迭代器

一、迭代器

    有时候我们在定义一个列表的时候,列表中的元素是具有一定规则的,这时候可以用列表生成式来提高一下我们的逼格。具体语法如下:

1 list = [i*3 for i in range(10)] #列表生成式 等价于 list = [0, 3, 6, 9, 12, 15, 18, 21, 24, 27]
2 print(list) #[0, 3, 6, 9, 12, 15, 18, 21, 24, 27]

理解了列表生成式的语法,生成器的写法就很容易了,只要将[]改成()即可,生成器的语法如下:

1 list_generate =  (i*3 for i in range(10)) #列表生成器
2 print(list_generate) #执行结果<generator object <genexpr> at 0x03327C30>

列表生成式是在执行程序之前,就将数据生成并存放在内存中,而生成器是一个算法,只有程序在执行的过程中才会生成当前所需要的数据。下图是这两种方式在内存的存储方式:

因此可以得出两种的区别:1、列表生成式占用内存,取的速度快  2、生成器占用很少内存,取的速度慢

对于生成器而言,要想获取生成器中的元素,需要每次调用其__next__()方法,如果我们的生成器有100万条数据,那我敢肯定你一定会疯掉的,因此我们一般用循环来取生成器中的数据,例如:

1 list_generate =  (i*3 for i in range(10)) #列表生成器
2 for i in list_generate:
3     print(i)

函数生成器

使用关键字yield定义生成器。

1 def getNo():
2     for i in  range(10):
3         yield i
4 f = getNo()
5 print(f.__next__())

其中f就是一个生成器,下面我们利用函数生成器来实现单线程下的并发效果(著名的生产者消费者模式)。

 1 import time
 2 def consmer(name):
 3     print("%s准备吃包子了。" % name)
 4     while True:
 5         baozi = yield
 6         print("%s号包子来了,被%s吃了" % (baozi, name))
 7 def producter(name):
 8     eat_p = consmer("吃货")
 9     eat_p1 = consmer("饿货")
10     eat_p.__next__()
11     eat_p1.__next__()
12     for i in range(1,100,2):
13         print("老子开始做包子了")
14         time.sleep(2)
15         print("%s做了2个包子" % name)
16         eat_p.send(i-1)
17         eat_p1.send(i)
18 producter("高文祥")

Iterable(可迭代对象)

我们已经知道,可以直接作用于for循环的数据类型有以下几种:一类是集合数据类型,如listtupledictsetstr等;一类是generator,包括生成器和带yield的generator function。这些可以直接作用于for循环的对象统称为可迭代对象:Iterable。可以使用isinstance()判断一个对象是否是Iterable对象。

from collections import  Iterable
print(isinstance([],Iterable),isinstance({},Iterable),isinstance(set,Iterable),isinstance("abc",Iterable))#执行结果True True False True

然而,生成器不但能够作用于for循环,还具有__next__()方法,像这种可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator。可以使用isinstance()判断一个对象是否是Iterator对象。

1 from collections import  Iterable,Iterator
2 print(isinstance([],Iterator),isinstance({},Iterator),isinstance(set,Iterator),isinstance("abc",Iterator),isinstance((i*2 for i in range(10)),Iterator))#执行结果False False False False True

然而,我们可以通过iter()方法把可迭代对象转换为迭代器

1 from collections import  Iterable,Iterator
2 print(isinstance(iter([]),Iterator))

那为什么像list,字典都不是迭代器呢?

这是因为Python的Iterator对象表示的是一个数据流,Iterator对象可以被next()函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()函数实现按需计算下一个数据,所以Iterator的计算是惰性的,只有在需要返回下一个数据时它才会计算。

Iterator甚至可以表示一个无限大的数据流,例如全体自然数。而使用list是永远不可能存储全体自然数的。

总结:

1、凡是可作用于for循环的对象都是Iterable类型;

2、凡是可作用于next()函数的对象都是Iterator类型,它们表示一个惰性计算的序列;

3、集合数据类型如listdictstr等是Iterable但不是Iterator,不过可以通过iter()函数获得一个Iterator对象。

4、Python的for循环本质上就是通过不断调用next()函数实现的,例如:

1 for x in [1, 2, 3, 4, 5]:
2     pass

其实际上的实现步骤为:

 1 # 首先获得Iterator对象:
 2 it = iter([1, 2, 3, 4, 5])
 3 # 循环:
 4 while True:
 5     try:
 6         # 获得下一个值:
 7         x = next(it)
 8     except StopIteration:
 9         # 遇到StopIteration就退出循环
10         break
posted @ 2018-02-05 18:34  高文祥888888  阅读(201)  评论(0编辑  收藏  举报