| | | |

|

python-----迭代器协议和生成器

迭代器协议和生成器

迭代器协议：

1、迭代器协议是指：对象必须提供一个next()方法，执行该方法要么返回迭代中的下一项，要么引起一个StopIteration异常，以终止迭代（只往后走，不能往前退----》模拟人更新换代）

2、可迭代对象：实现可迭代协议的对象。（对象内部定义一个__iter__()方法）

3、协议是一种约定，可迭代对象实现了可迭代协议，python的内部工具（如for sum max min...函数）使用迭代器协议访问对象。

for循环机制：

for循环的本质：循环所有对象，全部都使用迭代器协议。

for循环就是基于迭代器协议提供了一个统一的可遍历所有对象的方法，即在遍历之前，先调用对象的__iter__()方法将其转换为一个迭代器，然后使用迭代器协议去实现循环访问，这样所有对象都可以通过for循环来遍历了。

列表、字符串、元组、字典、集合、文件对象等本质上都不是可迭代对象，在使用for循环时内部先调用他们内部的__iter__方法，使它们变为一个可迭代对象，然后使用可迭代对象的next(可迭代对象)方法或者对象.__next__(),依次循环元素，当元素循环完时，会触发StopIteration异常，for循环会捕捉到这种异常，终止迭代。

访问方式：下标方式、迭代器协议、for循环：

下标：

1 # _*_ encoding:utf-8 _*_
2 __author__ = 'listen'
3 __date__ = '2018/11/19 22:10'
4 # li=[1,2,3,4,5]  #通过下标索引方式取   只试用于有序的 列表 元组 字符串  不适用无序字典 集合
5 # print(li[0])  #1
6 # print(li[1])  #2
7 # print(li[2])  #3

迭代器协议：

 1 #通过迭代器访问
 2 # li=[1,2,3,4,5,6]
 3 # iter_li=li.__iter__()  #通过__iter__()方法 生成一个可迭代对象
 4 # print(iter_li.__next__())  #1  可迭代对象就有__next__()方法  一个一个取值
 5 # print(iter_li.__next__())  #2
 6 # print(iter_li.__next__())  #3
 7 # print(iter_li.__next__())
 8 # print(iter_li.__next__())
 9 # print(iter_li.__next__())
10 # print(iter_li.__next__())  #StopIteration，超出边界报错

for循环访问：

 1 #for 循环访问的本质==遵循迭代器访问方式，先调用iter_l=li.__iter__()方法，然后依次执行iter_l.__next__(),直到for循环捕捉到StopIteration终止循环
 2 # li=[1,2,3,4,5]
 3 # for i in li:
 4 #     print(i)
 5 
 6 
 7 #用while去模拟for循环做的事情
 8 # li=[1,2,3,4,5]
 9 # index=0
10 # while index<len(li):
11 #     print(li[index])
12 #     index+=1
13 
14 
15 #next()和__next__()方法是相同的
16 # li=[1,2,3]
17 # iter_li=li.__iter__()
18 # print(iter_li.__next__())  #1
19 # print(next(iter_li))   #2

生成器

定义：生成器类似于一种数据类型，这种数据类型自动实现迭代器协议（其他的数据类型都需要调用自身的__iter__方法），所以生成器就是可迭代对象。

1、生成器函数：和常规函数没什么区别，但使用yield语句返回结果而不是return，yield语句一次返回一个结果，但每个结果中间，挂起函数的状态，以便下次从它离开的地方继续执行。

2、生成器表达式：类似于列表推导式，但是生成器返回按需产生的结果的一个对象（类似内存的一个地址），而不是一次构建结果的列表，按需取对象。

使用生成器的优点：

python使用生成器对延迟操作提了支持。所谓延迟操作，是指需要的时候才产生结果，而不是立即产生结果，节省内存，运行效率高，这是生成器的主要好处。

生成器表达式和列表表达式

三元表达式：f=if取出的结果 if条件 else else结果

列表解析：s=[三元表达式]，列表解析生成的是一个真实存在的列表，对于比较大的列表，消耗内存比较大。

count=[x for x in range(3)]

生成器表达式1:s=(三元表达式)，区别于列表解析是 [] 到 ()

count=(x for x in range(3))  #生成器本身就是迭代器，遵循迭代器协议

 1 #生成器----一种数据类型，这种数据类型自动实现迭代器协议（其他数据类型（字典 list tuple等等）都需要调用内置的__iter__()方法），所以生成器就是可迭代对象
 2 
 3 
 4 #1、生成器函数  yield 代替return语句返回  可以调用多次
 5 # def fun():
 6 #     yield 1  #可迭代对象
 7 #     yield 2
 8 #     yield 3
 9 # f=fun()
10 # print(f.__next__())  #1
11 # print(f.__next__())  #2
12 # print(f.__next__())  #3
13 # print(f.__next__()) ##执行只能一直往前走，不能往后，只能执行一次，执行完继续执行会触发StopIteration
14 
15 
16 
17 #2、生成器表达式
18 #三元表达式  result=值1  if 条件  else 值2  列表表达式=[]是真实存在内存中的列表，对于大的列表特别消耗内存
19 # count=[x for x in range(3)]    #三元表达式
20 # count=(x for x in range(3))  #生成器
21 # sum(x for x in range(3)) ##sum函数是Python的内置函数，该函数使用迭代器协议访问对象，而生成器实现了迭代器协议，不用多此一举先生成列表
22 
23 #鸡下蛋
24 laomuji=('鸡蛋%s'%i  for i in range(9) if i<5)
25 print(laomuji) #<generator object <genexpr> at 0x00000221029D1C50>  这是一个可迭代对象就不会占用很大的内存
26 print(laomuji.__next__())
27 print(laomuji.__next__())
28 print(laomuji.__next__())
29 print(laomuji.__next__())
30 print(laomuji.__next__())
31 print(next(laomuji))  #StopIteration抛异常

生成器只能往后走，不能往前退，且只能执行一次。

 1 # _*_ encoding:utf-8 _*_
 2 __author__ = 'listen'
 3 __date__ = '2018/11/20 21:14'
 4 # #执行只能一直往前走，不能往后，只能执行一次
 5 # def test():
 6 #     for i in range(4):
 7 #         yield i
 8 # t=test()
 9 # t1=(i for i in t)
10 # t2=(i for i in t1)
11 # print(list(t1))   #list（）就是在执行next方法  for也是在执行next方法  [0, 1, 2, 3]
12 # print(list(t2))  #  []  t1的数据取完了，没有了，所以list（t2）为空

发表于 2018-11-21 14:53 shijia_listen 阅读(227) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部