. ⽣成器

    什么是⽣成器, ⽣成器实质就是迭代器。python中有三种⽅式来获取⽣成器:

 1. 通过⽣成器函数

   2. 通过各种推导式来实现⽣成器

   3. 通过数据的转换也可以获取⽣成器

 ⾸先, 我们先看⼀个很简单的函数:

 

def func():
 	print("111")
 	return 222
ret = func()
print(ret)
结果: 
111
222

 

 

 将函数中的return换成yield就是⽣成器。

 

def func():
     print("111")
     yield 222
ret = func()
print(ret)
结果: 
<generator object func at 0x10567ff68>

 

  

  运⾏的结果和上⾯不⼀样. 为什么呢. 由于函数中存在了yield. 那么这个函数就是⼀个⽣成器函数. 这个时候. 我们再执⾏这个函数的时候. 就不再是函数的执⾏了. ⽽是获取这个⽣成器.如何使⽤呢? 想想迭代器. ⽣成器的本质是迭代器. 所以. 我们可以直接执⾏__next__()来执⾏以下⽣成器

 

def func():
 	print("111")
 	yield 222
gener = func() # 这个时候函数不会执⾏. ⽽是获取到⽣成器
ret = gener.__next__() # 这个时候函数才会执⾏. yield的作⽤和return⼀样. 也是返回
数据
print(ret)
结果: 
111
222

 

  

  那么我们可以看到, yieldreturn的效果是⼀样的有什么区别呢? yield是分段来执⾏⼀个函数; return? 直接停⽌执⾏函数当程序运⾏完最后⼀个yield,那么后⾯继续进⾏__next__()程序会报错StopIteration

    yield说了一部分了,那它有什么用呢?假设,某个工厂要为员工做工服,总数是10000套。

 

def doCloth():
    lst = []
    for i in range(1,10001):
        lst.append(‘工服%s’ % i)
    return lst    

 

  

       这种方式就是一次把所有的衣服都制作出来了,但是以实际考虑的话,全部做出来,这样有个弊端,这么多衣服不可能一次性全部使用了,那么在存放的过程中,很有可能被老鼠或者虫子咬破了。但是,看一下下面代码:

def doCloth():
    for i in range(1,10001):
        yield '衣服%s' % i
g = doCloth()
print(g.__next__())#衣服1
print(g.__next__())#衣服2
print(g.__next__())#衣服3

  

     可以看到,我需要一套,我就跟工厂说,给我做一套,这样就避免了自己长期储存了。

  可以看出来,returnyield的区别就是,return会把所有的一次性都做出来,占用很大内存,而yield只有需要的时候才会取一次值,不占用太大内存。还有一点,当函数遇到return时,这个函数就停止了,但是遇到yield,不会停止,还会继续执行下去。

  接下来我们来看send⽅法, send__next__()⼀样都可以让⽣成器执⾏到下⼀个yield. 

 

def eat():
    print("我吃什么啊")
    a = yield "馒头"
    print("a=",a)
    b = yield "⼤饼"
    print("b=",b)
    c = yield "⾲菜盒⼦"
    print("c=",c)
    yield "GAME OVER"
gen = eat() # 获取⽣成器
ret1 = gen.__next__()
print(ret1)
ret2 = gen.send("胡辣汤")
print(ret2)
ret3 = gen.send("狗粮")
print(ret3)
ret4 = gen.send("猫粮")
print(ret4)

  

        send__next__()区别:

        1. sendnext()都是让⽣成器向下走⼀次

        2. send可以给上⼀个yield的位置传递值, 不能给最后⼀个yield发送值. 在第⼀次执⾏⽣成器代码的时候不能使⽤send()

⽣成器可以使⽤for循环来循环获取内部的元素:

 

def func():
 	print(111)
 	yield 222
 	print(333)
 	yield 444
 	print(555)
 	yield 666
gen = func()
for i in gen:
 	print(i)
结果:
111
222
333
444
555
666

 

  

. 列表推导式, ⽣成器表达式以及其他推导式

    1.列表推导式

     列表推导式的结构:[结果 for循环 if条件]

  给出⼀个列表, 通过循环, 向列表中添加1-15 : 

 

lst = []
for i in range(1, 15):
 	lst.append(i)
print(lst)
 替换成列表推导式: 
lst = [i for i in range(1, 15)]
print(lst)

 

  

      列表推导式,把多行代码给简化成了一行,代码看着是简单了,但是这种方式出错后,不易排查,如果没有特别需要或者十足的把握,感觉还是不要用。

      2.生成器表达式

   ⽣成器表达式和列表推导式的语法基本上是⼀样的,只是把[]替换成()

   格式:(结果 for循环 if条件)

 

gen = (i for i in range(10))
print(gen)
结果: 
<generator object <genexpr> at 0x106768f10>

  打印的结果就是一个生成器在内存中的地址。我们可以使用for循环来循环这个生成器:

 

gen = (i for i in range(10))
for j in gen:
    print(j)

 

另一种方式创建一个生成器:

def fun(arg):
    print(arg)
fun(i for i in range(10))
类似的:print(i for i in range(10))

  

  

    3.列表推导式和生成器表达式的对比

  ⽣成器表达式和列表推导式的区别:

     1) 列表推导式比较耗内存. ⼀次性加载. ⽣成器表达式⼏乎不占⽤内存. 使⽤的时候才分、配和使⽤内存

     2) 得到的值不⼀样. 列表推导式得到的是⼀个列表. ⽣成器表达式获取的是⼀个⽣成器.

  ⽣成器的惰性机制: ⽣成器只有在访问的时候才取值。说⽩了你找他要他才给你值,不找他要,他是不会执⾏的。

 

def func():
 	print(111)
 	yield 222
g = func() # ⽣成器g,这里并没有执行括号里的代码
g1 = (i for i in g) # ⽣成器g1,但是g1的数据来源于g,这里并没有执行括号里的代码
g2 = (i for i in g1) # ⽣成器g2,数据来源g1,这里并没有执行括号里的代码

print(list(g)) # 获取g中的数据,这时func()才会被执⾏,打印111.获取到222,g完毕。
print(list(g1)) # 获取g1中中的数据,g1的数据来源是g,但是g已经取完了,g1 也就没有数据了。
print(list(g2)) # 和g1同理

#可以运行一下看看结果。

     4.字典推导式

  字典推导式格式 {k:v  for循环 if条件}

     # 把字典中的keyvalue互换

 

dic = {'a': 1, 'b': '2'}
new_dic = {dic[key]: key for key in dic}
print(new_dic)

  

     5.集合推导式

   集合推导式格式 {结果  for 循环  if条件},集合自带去重的效果,而且它里面是没有顺序的。代码:

 

lst = [2,2,3,4,'a','d','sd','we','a']
s = {el for el in lst}
print(s)
结果:
{2, 3, 4, 'we', 'sd', 'd', 'a'}

 

  

    6.yieldfrom

先看代码:

lst = [1,2,3]
def do():
    yield from lst
g = do()
print(g.__next__())
print(g.__next__())
print(g.__next__())

def do(a):
    for i in lst:
        yield i
g = do(1)
print(g.__next__())
print(g.__next__())
print(g.__next__())

  

下面代码中也可以看出来from替代了for循环。
def reader():
    """A generator that fakes a read from a file, socket, etc."""
    for i in range(4):
        yield '<< %s' % i
#
# def reader_wrapper(g):
#     # Manually iterate over data produced by reader
#     for v in g:
#         yield v

def reader_wrapper(g):
    yield from g

wrap = reader_wrapper(reader())
for i in wrap:
    print(i)

  

  从上面代码可以看出来,from类似于for循环,又是一个简化代码的方式。

   分析生成器原理很好的一片文章:https://www.jianshu.com/p/98fd8cd0094a

  总结: 推导式有, 列表推导式, 字典推导式, 集合推导式, 没有元组推导式(因为元组不能增删改,只能查看)

     ⽣成器表达式: (结果 for 变量 in 可迭代对象 if 条件筛选)

     ⽣成器表达式可以直接获取到⽣成器对象. ⽣成器对象可以直接进⾏for循环. ⽣成器具有惰性机制.