列表生成式、生成器和迭代器
一、列表生成式
列表生成:列表= [函数 for i in 列表]
现在有个需求,看列表[ 1, 2, 3, 4, 5, 6, 7, ],我要求你把列表里的每个值加1,你怎么实现?
# 第一种 使用map # a = [1,2,3,4,5,6] # def func(x): # return x+1 # b = map(func,a) # a = list(b) # print(a) # a = [1,2,3,4,5,6] # a = map(lambda x:x+1,a) # print(list(a))
# 第二种 使用append # a = [1,2,3,4,5,6] # b = [] # for i in a : # b.append(i+1) # a = b # print(a)
# 第三种 使用enumerate() # a = [1,2,3,4,5,6] # for v,i in enumerate(a): # a[v] +=1 # print(a)
# 第四种 列表生成式 # a = [1,2,3,4,5,6] # a = [i+1 for i in a] #格式 [函数 for i in 列表] # print(a)
二、生成器
通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。
所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。
生成器创建
1.要创建一个generator,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]
改成()
,就创建了一个generator:
# a = [1,2,3,4,5,6] # g = (i*i for i in range(10)) # g # generator object <genexpr> at 0x0000023134B2C570 # next(g) # next(g) # next(g) # next(g)
创建L
和g
的区别仅在于最外层的[]
和()
,L
是一个list,而g
是一个generator。
如果要一个一个打印出来,可以通过next()
函数获得generator的下一个返回值:
>>> next(g) 0 >>> next(g) 1 >>> next(g) 4 >>> next(g) 9 >>> next(g) 16 >>> next(g) 25 >>> next(g) 36 >>> next(g) 49 >>> next(g) 64 >>> next(g) 81 >>> next(g) Traceback (most recent call last): File "<stdin>", line 1, in <module> StopIteration
generator保存的是算法,每次调用next(g)
,就计算出g
的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration
的错误。
当然,上面这种不断调用next(g)
实在是太变态了,正确的方法是使用for
循环,因为generator也是可迭代对象:
# 遍历生成器 # g = (x+1 for x in range(10)) # for i in g: # print(i)
所以,我们创建了一个generator后,基本上永远不会调用next()
,而是通过for
循环来迭代它,并且不需要关心StopIteration
的错误。
generator非常强大。如果推算的算法比较复杂,用类似列表生成式的for
循环无法实现的时候,还可以用函数来实现。
比如,著名的斐波拉契数列(Fibonacci),除第一个和第二个数外,任意一个数都可由前两个数相加得到:1, 1, 2, 3, 5, 8, 13, 21, 34, ...
2.使用yield,函数生成器创建。斐波拉契数列用列表生成式写不出来,但是,用函数把它打印出来却很容易:
# 斐波拉契数列 # def fun(max): # a,b,n = 0,1,0 # while n <=max: # a,b = b,a+b # n+=1 # print(a) # # fun(7) # def fib(max): # a,b,n = 0,1,0 # while n <=max: # a,b = b,a+b # n+=1 # #print(a) # yield a ######变成生成器 # data = fib(10) # print(data) #<function fib at 0x0000020E6FD4A620> # print(next(data)) # print(next(data)) # print(next(data)) # print(next(data)) # print(next(data)) # print(next(data))
生成器send用法
def fun(): print('ok') yield 365 print('arms') count = yield 110 print('第三个yield:',count) yield 123 t = fun() p = next(t) # next(t)运行输出 OK 并且把365复制给p print(p) # 打印P 365 print(next(t)) # arms 110 print(t) # <generator object fun at 0x0000024FB4B5A0C0> print(t.send(112)) # 第三个yield: 112 123 count赋值112
迭代器
可以直接作用于for
循环的数据类型有以下几种:
- 一类是集合数据类型,如
list
、tuple
、dict
、set
、str
等; - 一类是
generator
,包括生成器和带yield
的generator function。
这些可以直接作用于for
循环的对象统称为可迭代对象:Iterable
。
可以使用isinstance()
判断一个对象是否是Iterable
对象:
>>> from collections import Iterable >>> isinstance([], Iterable) True >>> isinstance({}, Iterable) True >>> isinstance('abc', Iterable) True >>> isinstance((x for x in range(10)), Iterable) True >>> isinstance(100, Iterable) False
而生成器不但可以作用于for
循环,还可以被next()
函数不断调用并返回下一个值,直到最后抛出StopIteration
错误表示无法继续返回下一个值了。
迭代器:可以被next()
函数调用并不断返回下一个值的对象称为迭代器:Iterator
。
可以使用isinstance()
判断一个对象是否是Iterator
对象:
>>> from collections import Iterator >>> isinstance((x for x in range(10)), Iterator) True >>> isinstance([], Iterator) False >>> isinstance({}, Iterator) False >>> isinstance('abc', Iterator) False
生成器都是Iterator
对象,但list
、dict
、str
虽然是Iterable
,却不是Iterator
。
把list
、dict
、str
等Iterable
变成Iterator
可以使用iter()
函数:
>>> isinstance(iter([]), Iterator) True >>> isinstance(iter('abc'), Iterator) True
为什么list
、dict
、str
等数据类型不是Iterator
?
这是因为Python的Iterator
对象表示的是一个数据流,Iterator对象可以被next()
函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration
错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()
函数实现按需计算下一个数据,所以Iterator
的计算是惰性的,只有在需要返回下一个数据时它才会计算。
Iterator
甚至可以表示一个无限大的数据流,例如全体自然数。而使用list是永远不可能存储全体自然数的。
小结
凡是可作用于for
循环的对象都是Iterable
类型;
凡是可作用于next()
函数的对象都是Iterator
类型,它们表示一个惰性计算的序列;
集合数据类型如list
、dict
、str
等是Iterable
但不是Iterator
,不过可以通过iter()
函数获得一个Iterator
对象。
Python的for
循环本质上就是通过不断调用next()
函数实现的,例如:
for x in [1, 2, 3, 4, 5]: pass
等价于:
# 首先获得Iterator对象: it = iter([1, 2, 3, 4, 5]) # 循环: while True: try: # 获得下一个值: x = next(it) except StopIteration: # 遇到StopIteration就退出循环 break