python之 迭代器,生成器

什么叫跌代

可以将某个数据集合内的数据一个一个挨着取出来就叫做跌代。

迭代器协议:

可以被跌代要满足的要求叫做可迭代协议,可迭代对象必须提供一个next的方法,执行该方法要么返回跌代中的下一项,要么就引起一个StopIteration异常,以终止跌代(跌代只能往后走,而不能往前退)

python中的for循环:

for循环的本质就是遵循迭代器协议去访问对象,for循环可以遍历(字符串,列表,元祖,字典,集合,文件对象)这些对象都是不可迭代对象,只不过在for循环时,调用了他们内部的—iter—方法,把他们变成可迭代对象,然后for循环调用可迭代对象的—next—方法去取值,而且for循环会捕捉stoplteration异常,以终止跌代。

#while 循环模拟for循环
diedai_1 = l.__iter__()
while True :
    try:#错误处理机制
        print(diedai.__next__())
    except StopIteration:#自动捕捉stopiteration错误,防止报错
        print("跌代完成")
        break

for循环为我们提供了一个不依赖索引取值的方法,基于跌代器协议提供了一个统一的可以遍历所有对象的方法,在遍历之前,先调用对象的__iter__方法将其转换成一个迭代器,然后使用迭代器协议去实现循环访问,这样所有的对象都可以通过for循环来遍历了。

什么叫迭代器:

拥有__iter__方法和__next__方法的对象就叫迭代器

l = [1,2,3,4]
l_iter = l.__iter__()
item = l_iter.__next__()#每次取一个值
print(item)
item = l_iter.__next__()
print(item)
item = l_iter.__next__()
print(item)
item = l_iter.__next__()
print(item)
item = l_iter.__next__()#没有值了报错异常StopIteration
print(item)

 

迭代器的优点:提供一种不依赖索引的取值方式。

       惰性计算,节省内存。

迭代器的缺点:取值不如按照索引取值方便。

       一次性的,只能往后走,不能往前退。

         无法获取长度。

生成器:

什么是生成器:可以理解为一种数据类型,这种数据类型自动实现了迭代器协议(其他的数据类型需要调用自己内置的__iter__方法),所以生成器就是可迭代对象。

Python中提供的生成器:

1.生成器函数:常规函数定义,但是,使用yield语句而不是return语句返回结果。yield语句一次返回一个结果,在每个结果中间,挂起函数的状态,以便下次重它离开的地方继续执行

2.生成器表达式:类似于列表推导,但是,生成器返回按需产生结果的一个对象,而不是一次构建一个结果列表

生成器Generator:

  本质:迭代器(所以自带了__iter__方法和__next__方法,不需要我们去实现)

  特点:惰性运算,开发者自定义

生成器函数:


一个包含yield关键字的函数就是一个生成器函数。yield可以为我们从函数中的返回值,但是yield又不同于return,return的执行意味着程序的结束,调用生成器函数不会得到返回具体的值,而是得到一个可迭代的对象。每一次获取这个可迭代对象的值,就能推动函数的执行,获取新的返回值。直到函数执行的结束。

包含yield关键字的函数就叫生成器函数
def genrator_fun1():
    a =1
    print("现在定义了a变量")
    yield  a
    b = 2
    print("现在又定义了b变量")
    yield b
g1 = genrator_fun1()
print(g1)
print(next(g1))
print(next(g1))

生成器有什么好处呢,不会一下子在内存中生成太多数据,假如生产一批200000万件的衣服,一批一批的拿,就可以用生成器函数来表示。

def produce():
    for i in range(20000):
        yield "生产了第%s件衣服"%i
product_g = produce()
print(product_g.__next__())#第一件衣服
print(product_g.__next__())#第二件
print(product_g.__next__())#第三件
num = 0
for i in product_g:#取30件
    print(i)
    num += 1
    if num == 30:
        break

更多应用

import time
def tail(filename):
    f = open(filename)
    f.seek(0,2)#从文件末尾算
    while True:
        line = f.readline()#读取文件中新的文本行
        if not line:
            time.sleep(0.1)
            continue
        yield
tail_g = tail("tmp")#“tmp”文件名
for line in tail_g:
    print(line)
生成器监听文件输入
#模拟平均工资
def average():
    total = 0
    day = 0
    average = None
    while True:
        term = yield average#相当于return了一个average
        total += term#总工资等于这几天所有工资的和
        day += 1#天数过一天就加一
        average = total/day
avg = average()
next(avg)#这里是激活生成器,avg.send()什么值都不传,和next的效果一样
print(avg.send(10))#send有两个作用,传值和寻找下一个yield(next)
print(avg.send(20))
计算移动平均值

生成器想要运行,必须在调用的时候用next()方法来激活它,那么能不能不激活直接拿来就可以用呢,我们需要给生成器加上一个装饰器就可以解决这个问题了。

def init(func):
    def inner(*args,**kwargs):
        g = func(*args,**kwargs)#将函数average传入func()用g来接受返回值
        next(g)#在这里激活了生成器
        return g
    return inner
@init
def average():
    total = 0
    day = 0
    average = None
    while True:
        term = yield average
        total += term
        day += 1
        average = total/day
avg = average()
#next(avg),用装饰器执行了next方法
print(avg.send(10))
print(avg.send(100))
print(avg.send(150))
装饰器装饰生成器

yield from

def  gen1():
    for c in "AB":
        yield c
    for i in range(3):
        yield i
print(list(gen1()))#['A', 'B', 0, 1, 2]
def gen2():
    yield from "AB"
    yield from range(3)
print(list(gen2()))#['A', 'B', 0, 1, 2]

列表推导式和生成器解析式

egg_list = ["鸡蛋%s"% i for i in range(10)]
print(egg_list)#列表解析式
laomuji = ("鸡蛋%s"% i for i in range(10))
print(laomuji)#生成器表达式,就是将列表解析式的中括号[]换成()

列表解析式的[]换成()就是生成器表达式,列表解析与生成器表达式都是一种便利的编程方式,只不过生成器表达式比列表解析式更节省内存空间。python不但使用迭代器协议,让for循环变得更加通用,大部分内置函数,也是使用迭代器协议访问对象的。

总结:

可迭代对象:拥有__iter__()方法,特点就是惰性计算,节省内存。

迭代器:Iterator 拥有__iter__方法和__next__方法

生成器:Generator  本质即使迭代器  特点:延迟计算,一次返回一个结果,这对于大量的数据处理,将会非常有用。

 

posted on 2017-08-02 17:18  keepDoing  阅读(252)  评论(0编辑  收藏  举报

导航