迭代器协议和生成器
迭代器协议:
1、迭代器协议是指:对象必须提供一个next()方法,执行该方法要么返回迭代中的下一项,要么引起一个StopIteration异常,以终止迭代(只往后走,不能往前退----》模拟人更新换代)
2、可迭代对象:实现可迭代协议的对象。(对象内部定义一个__iter__()方法)
3、协议是一种约定,可迭代对象实现了可迭代协议,python的内部工具(如for sum max min...函数)使用迭代器 协议访问对象。
for循环机制:
for循环的本质:循环所有对象,全部都使用迭代器协议。
for循环就是基于迭代器协议提供了一个统一的可遍历所有对象的方法,即在遍历之前,先调用对象的__iter__()方法将其转换为一个迭代器,然后使用迭代器协议去实现循环访问,这样所有对象都可以通过for循环来遍历了。
列表、字符串、元组、字典、集合、文件对象等本质上都不是可迭代对象,在使用for循环时内部先调用他们内部的__iter__方法,使它们变为一个可迭代对象,然后使用可迭代对象的next(可迭代对象)方法或者 对象.__next__(),依次循环元素,当元素循环完时,会触发StopIteration异常,for循环会捕捉到这种异常,终止迭代。
访问方式:下标方式、迭代器协议、for循环:
下标:
1 # _*_ encoding:utf-8 _*_ 2 __author__ = 'listen' 3 __date__ = '2018/11/19 22:10' 4 # li=[1,2,3,4,5] #通过下标索引方式取 只试用于有序的 列表 元组 字符串 不适用无序字典 集合 5 # print(li[0]) #1 6 # print(li[1]) #2 7 # print(li[2]) #3
迭代器协议:
1 #通过迭代器访问 2 # li=[1,2,3,4,5,6] 3 # iter_li=li.__iter__() #通过__iter__()方法 生成一个可迭代对象 4 # print(iter_li.__next__()) #1 可迭代对象就有__next__()方法 一个一个取值 5 # print(iter_li.__next__()) #2 6 # print(iter_li.__next__()) #3 7 # print(iter_li.__next__()) 8 # print(iter_li.__next__()) 9 # print(iter_li.__next__()) 10 # print(iter_li.__next__()) #StopIteration,超出边界报错
for循环访问:
1 #for 循环访问的本质==遵循迭代器访问方式,先调用iter_l=li.__iter__()方法,然后依次执行iter_l.__next__(),直到for循环捕捉到StopIteration终止循环 2 # li=[1,2,3,4,5] 3 # for i in li: 4 # print(i) 5 6 7 #用while去模拟for循环做的事情 8 # li=[1,2,3,4,5] 9 # index=0 10 # while index<len(li): 11 # print(li[index]) 12 # index+=1 13 14 15 #next()和__next__()方法是相同的 16 # li=[1,2,3] 17 # iter_li=li.__iter__() 18 # print(iter_li.__next__()) #1 19 # print(next(iter_li)) #2
生成器
定义:生成器类似于一种数据类型,这种数据类型自动实现迭代器协议(其他的数据类型都需要调用自身的__iter__方法),所以生成器就是可迭代对象。
1、生成器函数:和常规函数没什么区别,但使用yield语句返回结果 而不是return,yield语句一次返回一个结果,但每个结果中间,挂起函数的状态,以便下次从它离开的地方继续执行。
2、生成器表达式:类似于列表推导式,但是生成器返回按需产生的结果的一个对象(类似内存的一个地址),而不是一次构建结果的列表,按需取对象。
使用生成器的优点:
python使用生成器对延迟操作提了支持。所谓延迟操作,是指需要的时候才产生结果,而不是立即产生结果,节省内存,运行效率高,这是生成器的主要好处。
生成器表达式和列表表达式
三元表达式:f=if取出的结果 if条件 else else结果
列表解析:s=[三元表达式],列表解析生成的是一个真实存在的列表,对于比较大的列表,消耗内存比较大。
count=[x for x in range(3)]
生成器表达式1:s=(三元表达式),区别于列表解析是 [] 到 ()
count=(x for x in range(3)) #生成器本身就是迭代器,遵循迭代器协议
1 #生成器----一种数据类型,这种数据类型自动实现迭代器协议(其他数据类型(字典 list tuple等等)都需要调用内置的__iter__()方法),所以生成器就是可迭代对象 2 3 4 #1、生成器函数 yield 代替return语句返回 可以调用多次 5 # def fun(): 6 # yield 1 #可迭代对象 7 # yield 2 8 # yield 3 9 # f=fun() 10 # print(f.__next__()) #1 11 # print(f.__next__()) #2 12 # print(f.__next__()) #3 13 # print(f.__next__()) ##执行只能一直往前走,不能往后,只能执行一次,执行完继续执行会触发StopIteration 14 15 16 17 #2、生成器表达式 18 #三元表达式 result=值1 if 条件 else 值2 列表表达式=[]是真实存在内存中的列表,对于大的列表特别消耗内存 19 # count=[x for x in range(3)] #三元表达式 20 # count=(x for x in range(3)) #生成器 21 # sum(x for x in range(3)) ##sum函数是Python的内置函数,该函数使用迭代器协议访问对象,而生成器实现了迭代器协议,不用多此一举先生成列表 22 23 #鸡下蛋 24 laomuji=('鸡蛋%s'%i for i in range(9) if i<5) 25 print(laomuji) #<generator object <genexpr> at 0x00000221029D1C50> 这是一个可迭代对象就不会占用很大的内存 26 print(laomuji.__next__()) 27 print(laomuji.__next__()) 28 print(laomuji.__next__()) 29 print(laomuji.__next__()) 30 print(laomuji.__next__()) 31 print(next(laomuji)) #StopIteration抛异常
生成器只能往后走,不能往前退,且只能执行一次。
1 # _*_ encoding:utf-8 _*_ 2 __author__ = 'listen' 3 __date__ = '2018/11/20 21:14' 4 # #执行只能一直往前走,不能往后,只能执行一次 5 # def test(): 6 # for i in range(4): 7 # yield i 8 # t=test() 9 # t1=(i for i in t) 10 # t2=(i for i in t1) 11 # print(list(t1)) #list()就是在执行next方法 for也是在执行next方法 [0, 1, 2, 3] 12 # print(list(t2)) # [] t1的数据取完了,没有了,所以list(t2)为空