生成器与生成器表达式
生成器
生成器的本质就是迭代器
生成器的特点:
1.惰性机制
2.只能向前
3.节省内存
在python中有三种方式获取生成器
1.通过生成器函数
2.通过各种推导式来实现生成器
3.通过数据的转换获取生成器
def func(): print("111") yield 222 gener = func() # 这个时候函数不会执行. 而是获取到生成器 ret = gener.__next__() # 这个时候函数才会执行. yield的作用和return一样. 也是返回数据 print(ret) 结果: 111 222
yield是分段执行一个函数,return是直接停止执行函数.
def func(): print("111") yield 222 print("333") yield 444 gener = func() ret = gener.__next__() print(ret) ret2 = gener.__next__() print(ret2) ret3 = gener.__next__() # 最后一个yield执行完毕. 再次__next__()程序报错, 也就是说和return无关了. print(ret3) 结果: 111 Traceback (most recent call last): 222 333 File "/Users/sylar/PycharmProjects/oldboy/iterator.py", line 55, in <module> 444 StopIteration #迭代器执行完毕
当程序执行完最后一个yield.后面继续__next__()程序会报错.
生成器的作用:
def cloth(): #定义一个函数 lst = [] for i in range(0, 10000): lst.append("衣服"+str(i)) return lst cl = cloth() #调用函数
def cloth(): #定义一个生成器函数 for i in range(0, 10000): yield "衣服"+str(i) cl = cloth() #获取生成器 print(cl.__next__()) #获取下一个值 print(cl.__next__()) print(cl.__next__()) print(cl.__next__())
第一个程序是一次性将所有衣服全部拿出来,很占内存.第二种使用生成器.一次就一个.用多少生成多少.
def eat(): print("我吃什么啊") a = yield "馒头" print("a=",a) b = yield "大饼" print("b=",b) c = yield "韭菜盒⼦" print("c=",c) yield "GAME OVER" gen = eat() # 获取生成器 ret1 = gen.__next__() print(ret1) ret2 = gen.send("胡辣汤") print(ret2) ret3 = gen.send("狗粮") print(ret3) ret4 = gen.send("猫粮") print(ret4) 结果: 我吃什么啊 馒头 a= 胡辣汤 大饼 b= 狗粮 韭菜盒⼦ c= 猫粮 GAME OVER
send()与__next__()的区别:
1.send和next()都是让生成器向下走一次
2.send可以给上一个yield的位置传递值,不能给最后一个yield发送值,第一次执行生成代码的时候不能使用send()
生成器可以使用for循环获取内部元素.
def func(): #定义生成器函数 print(111) yield 222 print(333) yield 444 print(555) yield 666 gen = func() #获取生成器 for i in gen: print(i) 结果: 111 222 333 444 555 666
列表推导式及生成器表达式:
列表推导式的常用写法:
[结果 for 变量 in 可迭代对象 判断条件]
# 获取1-100内所有的偶数 lst = [i for i in range(1, 100) if i % 2 == 0] print(lst)
两次循环
# 寻找名字中带有两个e的人的名字 names = [['Tom', 'Billy', 'Jefferson' , 'Andrew' , 'Wesley' , 'Steven' ,'Joe'], [ 'Alice', 'Jill' , 'Ana', 'Wendy', 'Jennifer', 'Sherry' , 1]] lst = [name for line in names for name in line if type(name) == str and name.count("e") == 2] print(lst) 结果: ['Jefferson', 'Wesley', 'Steven', 'Jennifer']
字典推导式:
{k:v for循环 条件筛选}
#将字典的键值相互调换 dic = {"jj": "林俊杰", "jay": "周杰伦", "zs": "赵四", "ln":"刘能"} d = {v : k for k,v in dic.items()} print(d) 结果: {'林俊杰': 'jj', '周杰伦': 'jay', '赵四': 'zs', '刘能': 'ln'}
利用集合推导式可以去重
#集合推导式 lst = [1, 1, 4, 6,7,4,2,2] s = { el for el in lst } print(s)
生成器表达式:
gen = (i for i in range(10)) print(gen) 结果: <generator object <genexpr> at 0x106768f10>
可以使用for循环循环生成器:
gen = ("麻花藤我第%s次爱你" % i for i in range(10)) for i in gen: print(i) 结果: 麻花藤我第0次爱你 麻花藤我第1次爱你 麻花藤我第2次爱你 麻花藤我第3次爱你 麻花藤我第4次爱你 麻花藤我第5次爱你 麻花藤我第6次爱你 麻花藤我第7次爱你 麻花藤我第8次爱你 麻花藤我第9次爱你
生成器表达式也可以进行筛选
# 获取1-100内能被3整除的数 gen = (i for i in range(1,100) if i % 3 == 0) for num in gen: print(num) # 100以内能被3整除的数的平方 gen = (i * i for i in range(100) if i % 3 == 0) for num in gen: print(num) #寻找名字中带有两个e的⼈的名字 names = [['Tom', 'Billy', 'Jefferson', 'Andrew', 'Wesley', 'Steven', 'Joe'], ['Alice', 'Jill', 'Ana', 'Wendy', 'Jennifer', 'Sherry', 'Eva']] # 不用推导式和表达式 result = [] for first in names: for name in first: if name.count("e") >= 2: result.append(name) print(result) # 推导式 gen = (name for first in names for name in first if name.count("e") >= 2) for name in gen: print(name)
生成器表达式和列表推导式的区别:
1.列表推导式比较耗内存,一次性加载.生成器表达式几乎不占内存,使用的时候才分配和使用内存
2.得到的值不一样,列表推导式得到的是一个列表.生成器表达式得到的是一个生成器.
生成器的惰性机制:生成器只有在访问的时候才取值.平常不执行.
def func(): print(111) yield 222 g = func() # 生成器g g1 = (i for i in g) # 生成器g1. 但是g1的数据来源于g g2 = (i for i in g1) # 生成器g2. 来源g1 print(list(g)) # 获取g中的数据. 这时func()才会被执行. 打印111.获取到222. g完毕. print(list(g1)) # 获取g1中的数据. g1的数据来源是g. 但是g已经取完了. g1 也就没有数据了 print(list(g2)) # 和g1同理 结果: 111 [222] [] []
注意:生成器只有在要值的时候才拿值.
推导式有列表推导式,字典推导式,集合推导式,没有元组推导式.
生成器表达式可以直接获取生成器对象,也可以进行for循环.
#关于生成器的一个很重要的题 def add(a, b): return a + b def test(): for r_i in range(4): yield r_i g = test() for n in [2, 10]: g = (add(n, i) for i in g) print(list(g)) 结果: [20, 21, 22, 23]