生成器 迭代器
生成器
1.什么是生成器
生成器的目的:节省内存空间,可以一个一个生成解释,访问的时候才存在,不访问不生成。
背景: 通过列表生成式,我们可以直接创建一个列表, 但是,收到内存限制,列表容量肯定是有限的。而且,创建一个由100万个元素的列表,
不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,而后面绝大多数元素占用的空间都白白浪费了。
所以,列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样不必创造出完整的list,从而节省大量的空间,在python中,这种一边循环,一边计算的机制,成为生成器,generator
2.怎么样写生成器:
2.1 列表生成式 [i*2 for i in range(10)]
2.2 将[]变为() (i *2 for i in range(10))
3.生成器特点:只有在调用时才会生成相应的数据,只记录当前位置, 只有一个next方法(不能向前取值) __next__()
生成器例子
b = (i *2 for i in range(10)) for i in b: print(i)
4.生成器的例子
def fib(max): n, a, b = 0, 0, 1 #先预先定义初始值 while n < max: # n<10 #print(b) 将打印语句变为yield,即成为生成器 yield b # 变为生成器 a,b=b,a+b n=n+1 return "done" #print(fib(10)) f=fib(10) print(f.__next__()) print("============") print(f.__next__()) print(f.__next__()) print(f.__next__()) print("start loop") #每次开始都会停留在上一次读取的位置 for i in f: print(i)
5. 有Exception 的例子
def fib(max): n,a,b=0,0,1 while n<max: a,b=b,a+b yield b n=n+1 return "done" f=fib(5) #如下报出来了异常,我们应该抓住这个异常,如fib2.py while True: try: #执行下列代码 x = next(f) # next(iterator) print(x) except StopIteration as e: #当有StopIteration异常时,执行下列打印语句 print("Generator return value:",e.value) break
当执行next() 函数时,如果超出了迭代器的范围,就会抛出异常,这时我们可以抓住异常
迭代器
1. 什么是迭代器
可直接作用于for循环的数据类型有以下几种:
一类是集合数据类型, 如list, tuple,dict,set,string
一类是 generator(生成器),包括生成器和带yield 的generator function
这些可以直接作用于for循环的对象统称为可迭代对象,Iterable.
可以被next()函数调用并不断返回下一个值的对象成为迭代器:Iterator
Iterator=Iterable+next(),如何确定一个对象是否是迭代对象
可使用isinstance() 判断一个对象是否是Iterable对象
>>> from collections import Iterable >>> isinstance([],Iterable) True >>> isinstance('frank',Iterable) True
3. 将Iterable 变为Iterator
生成器都是迭代器;list,dict,str虽然都是Iterable,却不是Iterator,把list,dict,str等Iterable变成Iterator 可使用Iter()函数.
range(10)是一个迭代器
4.为什么 list,dict, str等数据流类型不是Iterator?
这是因为python的Iterartor对象表示的是一个数据流, Iterator对象可以被next() 函数调用并不断返回下一个数据,直到没有数据流时抛出
StopIteration错误,可以把这个数据流看作是一个有序序列,但我们却不能提前知道序列的长度, 只能通过next()函数实现按需计算下一个数据,
所以在Iterator的计算是惰性的, 只有在需要返回下个数据时才会计算。
Iterator 甚至可以表示一个无限大的数据流, 例如全体自然数,而使用list永远不会存储全体自然数。
凡是可作用于for循环的对象都是Iteratable类型
凡是可作用于next()函数的对象是Iterator类型,它表示一个惰性计算的序列。