迭代器协议和生成器

迭代器协议:

1、迭代器协议是指:对象必须提供一个next()方法,执行该方法要么返回迭代中的下一项,要么引起一个StopIteration异常,以终止迭代(只往后走,不能往前退----》模拟人更新换代)

2、可迭代对象:实现可迭代协议的对象。(对象内部定义一个__iter__()方法)

3、协议是一种约定,可迭代对象实现了可迭代协议,python的内部工具(如for sum max min...函数)使用迭代器 协议访问对象。

for循环机制:

for循环的本质:循环所有对象,全部都使用迭代器协议。

for循环就是基于迭代器协议提供了一个统一的可遍历所有对象的方法,即在遍历之前,先调用对象的__iter__()方法将其转换为一个迭代器,然后使用迭代器协议去实现循环访问,这样所有对象都可以通过for循环来遍历了。

列表、字符串、元组、字典、集合、文件对象等本质上都不是可迭代对象,在使用for循环时内部先调用他们内部的__iter__方法,使它们变为一个可迭代对象,然后使用可迭代对象的next(可迭代对象)方法或者 对象.__next__(),依次循环元素,当元素循环完时,会触发StopIteration异常,for循环会捕捉到这种异常,终止迭代。

访问方式:下标方式、迭代器协议、for循环:

下标:

1 # _*_ encoding:utf-8 _*_
2 __author__ = 'listen'
3 __date__ = '2018/11/19 22:10'
4 # li=[1,2,3,4,5]  #通过下标索引方式取   只试用于有序的 列表 元组 字符串  不适用无序字典 集合
5 # print(li[0])  #1
6 # print(li[1])  #2
7 # print(li[2])  #3

 迭代器协议:

 1 #通过迭代器访问
 2 # li=[1,2,3,4,5,6]
 3 # iter_li=li.__iter__()  #通过__iter__()方法 生成一个可迭代对象
 4 # print(iter_li.__next__())  #1  可迭代对象就有__next__()方法  一个一个取值
 5 # print(iter_li.__next__())  #2
 6 # print(iter_li.__next__())  #3
 7 # print(iter_li.__next__())
 8 # print(iter_li.__next__())
 9 # print(iter_li.__next__())
10 # print(iter_li.__next__())  #StopIteration,超出边界报错

for循环访问:

 1 #for 循环访问的本质==遵循迭代器访问方式,先调用iter_l=li.__iter__()方法,然后依次执行iter_l.__next__(),直到for循环捕捉到StopIteration终止循环
 2 # li=[1,2,3,4,5]
 3 # for i in li:
 4 #     print(i)
 5 
 6 
 7 #用while去模拟for循环做的事情
 8 # li=[1,2,3,4,5]
 9 # index=0
10 # while index<len(li):
11 #     print(li[index])
12 #     index+=1
13 
14 
15 #next()和__next__()方法是相同的
16 # li=[1,2,3]
17 # iter_li=li.__iter__()
18 # print(iter_li.__next__())  #1
19 # print(next(iter_li))   #2

生成器

定义:生成器类似于一种数据类型,这种数据类型自动实现迭代器协议(其他的数据类型都需要调用自身的__iter__方法),所以生成器就是可迭代对象。

1、生成器函数:和常规函数没什么区别,但使用yield语句返回结果 而不是return,yield语句一次返回一个结果,但每个结果中间,挂起函数的状态,以便下次从它离开的地方继续执行。

2、生成器表达式:类似于列表推导式,但是生成器返回按需产生的结果的一个对象(类似内存的一个地址),而不是一次构建结果的列表,按需取对象。

使用生成器的优点:

python使用生成器对延迟操作提了支持。所谓延迟操作,是指需要的时候才产生结果,而不是立即产生结果,节省内存,运行效率高,这是生成器的主要好处。

生成器表达式和列表表达式

三元表达式:f=if取出的结果 if条件  else  else结果

列表解析:s=[三元表达式],列表解析生成的是一个真实存在的列表,对于比较大的列表,消耗内存比较大。

count=[x for x in range(3)]

生成器表达式1:s=(三元表达式),区别于列表解析是 [] 到 ()

 

count=(x for x in range(3))  #生成器本身就是迭代器,遵循迭代器协议

 

 1 #生成器----一种数据类型,这种数据类型自动实现迭代器协议(其他数据类型(字典 list tuple等等)都需要调用内置的__iter__()方法),所以生成器就是可迭代对象
 2 
 3 
 4 #1、生成器函数  yield 代替return语句返回  可以调用多次
 5 # def fun():
 6 #     yield 1  #可迭代对象
 7 #     yield 2
 8 #     yield 3
 9 # f=fun()
10 # print(f.__next__())  #1
11 # print(f.__next__())  #2
12 # print(f.__next__())  #3
13 # print(f.__next__()) ##执行只能一直往前走,不能往后,只能执行一次,执行完继续执行会触发StopIteration
14 
15 
16 
17 #2、生成器表达式
18 #三元表达式  result=值1  if 条件  else 值2  列表表达式=[]是真实存在内存中的列表,对于大的列表特别消耗内存
19 # count=[x for x in range(3)]    #三元表达式
20 # count=(x for x in range(3))  #生成器
21 # sum(x for x in range(3)) ##sum函数是Python的内置函数,该函数使用迭代器协议访问对象,而生成器实现了迭代器协议,不用多此一举先生成列表
22 
23 #鸡下蛋
24 laomuji=('鸡蛋%s'%i  for i in range(9) if i<5)
25 print(laomuji) #<generator object <genexpr> at 0x00000221029D1C50>  这是一个可迭代对象就不会占用很大的内存
26 print(laomuji.__next__())
27 print(laomuji.__next__())
28 print(laomuji.__next__())
29 print(laomuji.__next__())
30 print(laomuji.__next__())
31 print(next(laomuji))  #StopIteration抛异常

 生成器只能往后走,不能往前退,且只能执行一次。

 1 # _*_ encoding:utf-8 _*_
 2 __author__ = 'listen'
 3 __date__ = '2018/11/20 21:14'
 4 # #执行只能一直往前走,不能往后,只能执行一次
 5 # def test():
 6 #     for i in range(4):
 7 #         yield i
 8 # t=test()
 9 # t1=(i for i in t)
10 # t2=(i for i in t1)
11 # print(list(t1))   #list()就是在执行next方法  for也是在执行next方法  [0, 1, 2, 3]
12 # print(list(t2))  #  []  t1的数据取完了,没有了,所以list(t2)为空