Lyf凤

靡不有初,鲜克有终

扩大
缩小

生成器和各种推导式

昨日回顾

1. 函数名 -> 第一类对象
        函数名就是变量名.
        函数可以赋值
        函数可以作为集合类的元素
        函数可以作为参数传递
        函数可以作为返回值返回
    2. 闭包
        语法: 内层函数对外层函数的局部变量的使用
        def wrapper():
            name = ""
            def inner():
                return name
            return inner

        如何查看一个函数是否是闭包
        函数名.__closure__  有值就是闭包. None就不是闭包

        优点:
            1. 保护变量不被侵害 (javascript)
            2. 可以让一个变量常驻内存

    3. 迭代器
        在数据中包含了__iter__是一个可迭代对象.
        for循环内部

        it = lst.__iter__()
        while 1:
            try:
                it.__next__()
            except StopIteration:
                break

        特点:
            1. 节省内存
            2. 惰性机制
            3. 只能向前, 不能反复

        意义: 统一数据类型的遍历工作

        官方查看xxx是迭代器, 可迭代对象
        from collections import Iterable, Iterator

        isinstance(对象, Iterable)
        isinstance(对象, Iterator)

        迭代器一定可迭代   ->   for循环
        可迭代的不一定是迭代器
View Code

 

今日内容

1. 生成器
        本质就是迭代器.
        一个一个的创建对象
        创建生成器的方式:
            1. 生成器函数
            2. 通过生成器表达式来获取生成器
            3. 类型转换(看不到)
    2. 生成器函数 (重点)
        生成器函数中包含 yield , 返回数据和return差不多.
        return会立即结束这个函数的执行
        yield 可以分段的执行一个函数

        生成器函数在执行的时候返回生成器. 而不是直接执行此函数

        能向下执行的两个条件:
            __next__(), 执行到下一个yield
            send(), 执行到下一个yield, 给上一个yield位置传值

        所有的生成器都是迭代器都可以直接使用for循环
        都可以使用list()函数来获取到生成器内所有的数据

        生成器(##每次调用生成器函数就创建了一个生成器)中记录的是代码而不是函数的运行
        def func():
            print("我的天哪 ")
            yield "宝宝"

        △(理解记忆) gen = func() # 创建生成器.  此时运行会把生成器函数中的代码记录在内存,当执行到__next__(),
         运行此空间中的代码, 运行到yield结束.

        优点: 节省内存, 生成器本身就是代码. 几乎不占用内存
        特点: 惰性机制, 只能向前. 不能反复

    3. 各种推导式 (诡异)
        列表推导式  [结果 for循环 if]
        字典推导式 {结果(k:v) for循环 if}
        集合推导式 {结果(k) for循环 if}



    4. 生成器表达式 (重点)
        (结果 for循环 if)
        老师讲的所谓的与生成器函数相比  生成器表达式是一次性的.是指生成器函数通过gen = func()创建生成器 之后可以反复的调用生成器,
而生成器表达式一次执行完之后,下次执行还要重新写一次.

一.生成器

什么是生成器.生成器实质就是迭代器.
在python中有三种方式来获取生成器:
  1.通过生成器函数
  2.通过各种推导式来实现生成器
  3.通过数据的转换也可以获取生成器


首先,我们先看一个很简单的函数:

def func():
    print("111")
    return 222

ret = func()
print(ret)

结果:
111
222

将函数中的return换成yield就是生成器

def func() :
    print("111")
    yield 222

ret = func()
print(ret)

结果:
<generator object func at 0x10567ff68>

运行的结果和_上面不一样. 为什么呢.由于函数中存在了yield.那么这个函数就是一个生成器函数.这个时候.我们再执行这个函数的时候.就不再是函数的执行了.而是获取这个生成器.如何使用呢?想想迭代器.生成器的本质是迭代器.所以.我们可以直接执行__next__()来执行以下生成器.

def func():
    printC111")
    yield 222

gener = func() # 这个时候函数不会执行,而是获取到生成器
ret = gener.__next___ () # 这个时候函数才会执行,yield的作用和return- 样,也是返回数据

print(ret)
结果:
111
222

那么我们可以看到, yield和return的效果是-样的.有什么区别呢? yield是分段来执行一个函数. return呢?直接停止执行函数.

def func():
    print("111")
    yield 222
    print("333")
    yield 444

gener = func()
ret = gener.__next__()
print(ret)
ret2 = gener.__next__()
print(ret2)
ret3 = gener.__next__() # 最后一个yield执行完毕,再次__next__()程序报错, 也就是说,和return无关了
print(ret3)

结果:
111
Traceback (most recent call last):
222
333
File "/Users/sylar/PycharmProjects/oldboy/iterator.py", line 55, in <module>
444
ret3 = gener.__ .next__ .(0) # 最后一个yield执行完毕,再次__next__()程序报错, 也就是说,和return无关了
StopIteration

当程序运行完最后一个yield.那么后面继续进行__next__()程序会报错.
好了生成器说完了.生成器有什么作用呢?我们来看这样一个需求. 老男孩向JACK JONES订购10000套学生服. JACK JONES就比较实在.直接造出来10000套衣服.

def cloth():
    lst =[]
    for i in range(0, 10000):
        lst. append("衣服" +str(i))
    return lst

cl = cloth()    

但是呢,问题来了.老男孩现在没有这么多学生啊.一次性给我这么多.我往哪里放啊.很尴尬啊.最好的效果是什么样呢?我要1套.你给我1套.一共1000套.是不是最完美的

def cloth():
    for i in range(0, 10000):
        yield “衣服"+str(i)

cl = cloth()
print(cl.__next__())
print(cl.__next__())
print(cl.__next__())
print(cl.__next__())

区别:第一种是直接一次性全部拿出来,会很占用内存.第二种使用生成器,-次就-个,用多少生成多少.生成器是一个一个的指向下一个.不会回去,__next__()到哪, 指针就指到哪儿.下一次继续获取指针指向的值

接下来我们来看send方法, send和__next__()一样都可以让生成器执行到下一个yield.

def eat():
    print("我吃什么啊")
    a = yield "馒头"
    print("a=",a)
    b = yield “大饼”
    print("b=",b)
    c = yield “韭菜盒子”
    print("c=",c)
    yield "GAME OVER"

gen = eat()#获取生成器
ret1 = gen.__next__()
print(ret1)
ret2 = gen. send("胡辣汤")
print(ret2)
ret3 = gen. send("狗粮")
print(ret3)
ret4 = gen. send("猫粮")
print(ret4)

send和__next__()区别:
  1. send和next()都是让生成器向下走-次
  2. send可 以给上一个yield的位置传递值,不能给最后-个yield发送值. 在第一次执行生成器代码的时候不能使用send()


生成器可以使用for循环来循环获取内部的元素:

def func():
    print(111)
    yield 222
    print(333)
    yield 444
    print(555)
    yield 666

gen = func()
for i in gen:
    print(i)


结果:
111
222
333
444
555
666

二.列表推导式,生成器表达式以及其他推导式

列表推导式

首先我们先看一下这样的代码,给出一个列表,通过循环,向列表中添加1-14 :

lst=[]
for i in range(1,15):
    lst . append(i)
print(lst)

替换成列表推导式:

lst = [i for i in range(1, 15)]
print(lst)

列表推导式是通过-行来构建你要的列表,列表推导式看起来代码简单.但是出现错误之后很难排查.

列表推导式的常用写法:
  [结果 for 变量 in 可迭代对象]


例.从python1期到python14期写入列表Ist:

lst = ['python%s' % i for i in range(1,15)]
print(lst)

我们还可以对列表中的数据进行筛选

筛选模式:
  [结果 for 变量 in 可迭代对象 if条件]

#获取1-100内所有的偶数
lst = [i for i in range(1, 100)  if i % 2 == 0]
print(lst)

生成器表达式

生成器表达式和列表推导式的语法基本上是一样的.只是把[]替换成()

gen = (i for i in range(10))
print(gen)

结果:
<generator object <genexpr> at 0x106768f10>

打印的结果就是一个生成器.我们可以使用for循环来循环这个生成器:

gen = ("麻花藤我第%s次爱你”% i for i in range(10))
for i in gen:
    print(i)

生成器表达式也可以进行筛选:

#获取1-100内能被3整除的数
gen = (i for i in range(1,100) if i % 3 == 0)
for num in gen:
    print(num)

# 100以内能被3整除的数的平方
gen=(i*i for i in range(100) if i % 3 == 0)
for num in gen:
    print(num)

#寻找名字中带有两个e的人的名字
names = [['Tom', 'Billy', 'Jefferson', 'Andrew', 'Wesley', 'Steven' ,'Joe'],
['Alice', 'Jill', 'Ana', 'Wendy', 'Jennifer', 'Sherry',‘Eva']]

#不用推导式和表达式
result =[]
for first in names:
    for name in first:
        if name.count("e") >= 2:
            result.append( name)
print(result)
#推导式
gen = (name for first in names for name in first if name.count("e") >= 2)
for name in gen:
    print(name)

生成器表达式和列表推导式的区别:
  1.列表推导式比较耗内存. -次性加载.生成器表达式几乎不占用内存.使用的时候才分配和使用内存
  2.得到的值不- -样.列表推导式得到的是一个列表.生成器表达式获取的是一个生成器.


举个栗子.
  同样-篮子鸡蛋. 列表推导式:直接拿到-篮子鸡蛋.生成器表达式:拿到-个老母鸡.需要鸡蛋就给你下鸡蛋.

生成器的惰性机制:生成器只有在访问的时候才取值.说白了,你找他要他才给你值,不找他要,他是不会执行的.

def func():
    print(111)
    yield 222

g = func() #生成器g,没人要值,所以没有执行
g1 = (i for i in g) #生成器g1. 但是g1的数据来源于g.没人要值,所以没有执行
g2=(i for i in g1) #生成器g2.来源g1.没人要值,所以没有执行

print(list(g)) # 获取g中的数据,这时func()才会被执行,打印111 .获取到222. g完毕.
print(list(g1)) # 获取g1中的数据. g1的数据来源是g.但是g已经取完了。g1也就没有数据了
print(list(g2)) # 和g1同理

深坑==>生成器.要值得时候才拿值

字典推导式:

根据名字应该也能猜到.推到出来的是字典

#把字典中的key和value互换
dic = {'a': 1, 'b': '2'}
new_ dic = {dic[key]: key for key in dic}
print(new_ dic)

#在以下list中,从lst1中获取的数据和lst2中相对应的位置的数据组成一个新字典
lst1 = ['jay', 'jj''sylar']
lst2 = ['周杰伦",'林俊杰’, '邱彦涛']
dic = {lst1[i]: lst2[订] for i in range(len(lst1))}
print(dic)

 

集合推导式:

集合推导式可以帮我们直接生成一个集合. 集合的特点:无序,不重复.所以集合推导式自带去重功能

lst = [1, -1, 8, -8,12]
#绝对值去重
s = {abs(i) for i in lst}
print(s)

 

总结:推导式有,列表推导式,字典推导式,集合推导式,没有元组推导式
  生成器表达式: (结果 for 变量 in 可迭代对象 if条件筛选)
  生成器表达式可以直接获取到生成器对象.生成器对象可以直接进行for循环.生成器具有惰性机制.

经典面试题

一个面试题.难度系数0000000颗星:

def add(a, b): 
    return a + b

def test():
    for i in range(4):
        yield i


g = test()

for n in [2, 10]:
    g=(add(n,i) for i in g)

print(list(g))

友情提示:惰性机制,不到最后不会拿值
这个题要先读一下. 然后自己分析出结果.最后用机器跑一下

 

# 生成器经典题
def add(a, b): # 相加
    return a + b

def test(): # 生成器函数 0  1   2  3
    for i in range(4):
        yield i

g = test()  # 创建生成器

for n in [2, 10]:
    g = (add(n, i) for i in g)

print(list(g))
# 结果:[20,21,22,23]
# 解题思路:惰性机制(#有人要值才执行);生成器记录的是代码(#只有在执行的时候才会带入变量的值)
# 1,拆分for循环
n = 2
g = (add(n, i) for i in g)
n = 10
g = (add(n, i) for i in g)
# 2,将g = test()代入,并层层带入
n = 2
g = (add(n, i) for i in test())
n = 10
g = (add(n, i) for i in (add(n, i) for i in test()))
# 3,拿值的时候带入变量的值去执行
print(list(g))  # 拿值list==>for==>__next__()
# 此时的
g = (add(n, i) for i in (add(n, i) for i in test()))
# 代入变量的值
# n = 10
# test()的取值范围是[0,1,2,3]
# 所以
# list(g) == [(add(10, i) for i in (add(10, i) for i in [0,1,2,3]))]==10*2+[0,1,2,3]
#         == [(add(10, i) for i in [10,11,12,13]]
#         == [20,21,22,23]


# 小结规律:
# test()的取值范围是初始范围
# 要拿值时候的n的值是要带入的值
# for循环决定循环的次数,循环几次就累加几次,也就是要加几个n的值


# 改变1
def add(a, b): # 相加
    return a + b

def test(): # 生成器函数 0  1   2  3
    for i in range(4):
        yield i

g = test()  # 创建生成器

for n in [2, 10]:
    g = (add(n, i) for i in g)
n = 5

print(list(g))
# 结果:[10,11,12,13]
# 解题思路同上,最终拿到
# g = (add(n, i) for i in (add(n, i) for i in test()))
# 而此时n=5,带入得到 5*2+[0,1,2,3]=[10,11,12,13]



# 改变2
def add(a, b): # 相加
    return a + b

def test(): # 生成器函数 0  1   2  3
    for i in range(4):
        yield i

g = test()  # 创建生成器

for n in [2, 10, 5]:
    g = (add(n, i) for i in g)


print(list(g))

# 解题思路同上,最终拿到
n = 2
g = (add(n, i) for i in g)
n = 10
g = (add(n, i) for i in g)
n = 5
g = (add(n, i) for i in g)


# 层层代入得到:
n = 2
g = (add(n, i) for i in test())
n = 10
g = (add(n, i) for i in (add(n, i) for i in test()))
n = 5
g = (add(n, i) for i in (add(n, i) for i in (add(n, i) for i in test())))
# 代入数据得到:
list(g) =  (add(5, i) for i in (add(5, i) for i in (add(5, i) for i in [0,1,2,3])))=5*3+[0,1,2,3]=[15,16,17,18]

 

区别生成器表达式和列表生成式:

def add(a, b):
    return a + b


def test():
    # print("123")
    for i in range(4):#[0,1,2,3]
        yield i

g = test()

for n in [2, 10, 5]:
    # 第一种:生成器表达式
    # g = (add(n, i) for i in g)  # [15, 16, 17, 18]在生成器表达式内部的生成器或者生成器表达式是不会执行的,直到外部的生成器有人找它要值
    # 第二种:列表生成式,是会直接带入执行的
    g = [add(n, i) for i in g]  # [17, 18, 19, 20]
#第一种:
# 对for循环进行等价替换,全部代入n=5
# g1 = (add(5, i) for i in g)  #g = test()= [0,1,2,3]
# g2 = (add(5, i) for i in g1)
# g3 = (add(5, i) for i in g2)
#第二种:
# 对for循环进行等价替换,分别代入n=2,10,5
# g1 = (add(2, i) for i in g)  #g = test()= [0,1,2,3]
# g2 = (add(10, i) for i in g1)
# g3 = (add(5, i) for i in g2)



print(list(g))

 

 

 

 

今日作业

 

posted on 2019-07-28 09:57  Lyf凤  阅读(534)  评论(0编辑  收藏  举报

导航

levels of contents