Python基础(8)迭代器、生成器

一 什么是迭代
1 重复
2 下一次重复是基于上一次的结果
# while True:
#     cmd=input('>>: ')
#     print(cmd)

# l=['a','b','c','d']
# count=0
# while count < len(l):
#     print(l[count])
#     count+=1

#
# l=['a','b','c','d']
# for count in range(len(l)):
#     print(l[count])


# d={'a':1,'b':2,'c':3}
#
# for k in d:
#     print(k)

python为了提供一种不依赖于索引的迭代方式,
python会为一些对象内置__iter__方法
obj.__iter__称为可迭代的对象

二 可迭代对象:obj.__iter__
三 迭代器:iter1=obj.__iter__()
1 iter1.__next__
2 iter1.__iter__ 
iter1.__next__()

迭代器的优点
1:提供了一种不依赖于索引的取值方式
2:惰性计算。节省内存

迭代器的缺点:
1:取值不如按照索引取值方便
2:一次性的。只能往后走不能往前退
3:无法获取长度

l=[1,2,3]
for item in l: #i=l.__iter__()
    print(item)
l=['x','y','z']
# print(l[2])
# print(l[0])

# i=l.__iter__()
# print(i.__next__())
# print(i.__next__())
# print(i.__next__())

  

#得到的迭代器:既有__iter__又有一个__next__方法
# d={'a':1,'b':2,'c':3}
#
# i=d.__iter__() #i叫迭代器
# print(i)
# print(i.__next__())
# print(i.__next__())
# print(i.__next__())
# print(i.__next__()) #StopIteration

  

  

iterator判断是否为迭代器对象
iterabl判断是否为可迭代对象
迭代对象需要.__iter__()转换成迭代器,才能迭代
迭代器对象可以直接迭代
迭代器的应用:
1 提供了一种不依赖索引的统一的迭代方法
2 惰性计算,比如取文件的每一行
 

 

四、生成器
1、生成器函数:函数体内包含有yield关键字,该函数执行的结果是生成器

 

def foo():
    print('first------>')
    yield 1
    print('second----->')
    yield 2
    print('third----->')
    yield 3
    print('fouth----->')


g=foo()

2、生成器就是迭代器

 

# print(g.__next__())
# print(g.__next__())
# print(g.__next__())
# print(g.__next__())

# for i in g: #obj=g.__iter__() #obj.__next__()
#     print(i)

3、

yield的功能:
1.与return类似,都可以返回值,但不一样的地方在于yield返回多次值,而return只能返回一次值
2.为函数封装好了__iter__和__next__方法,把函数的执行结果做成了迭代器
3.遵循迭代器的取值方式obj.__next__(),触发的函数的执行,函数暂停与再继续的状态都是由yield保存的

def countdown(n):
    print('starting countdown')

    while n > 0:
        yield n
        n-=1
    print('stop countdown')
g=countdown(5)
# print(g)
# print(g.__next__())
# print(g.__next__())
# print(g.__next__())
# print(g.__next__())
# print(g.__next__())
# print(g.__next__())

#
# for i in g:
#     print(i)

例题:

#1 编写 tail -f a.txt |grep 'error' |grep '404'命令
import time
def tail(filepath,encoding='utf-8'):
    with open(filepath,encoding=encoding) as f:
        f.seek(0,2)
        while True:
            line=f.readline()
            if line:
                yield line
            else:
                time.sleep(0.5)

def grep(lines,pattern):
    for line in lines:
        if pattern in line:
            #print(line)
            yield line

g1=tail('a.txt')
g2=grep(g1,'error')
g3=grep(g2,'404')
for i in g3:
    print(i)

总结:

1.迭代器协议是指:对象必须提供一个next方法,执行该方法要么返回迭代中的下一项,要么就引起一个StopIteration异常,以终止迭代 (只能往后走不能往前退)

2.可迭代对象:实现了迭代器协议的对象(如何实现:对象内部定义一个__iter__()方法)

3.协议是一种约定,可迭代对象实现了迭代器协议,python的内部工具(如for循环,sum,min,max函数等)使用迭代器协议访问对象。

4.for循环的本质:循环所有对象,全都是使用迭代器协议。

5.(字符串,列表,元组,字典,集合,文件对象)这些都不是可迭代对象,只不过在for循环式,调用了他们内部的__iter__方法,把他们变成了可迭代对象

然后for循环调用可迭代对象的__next__方法去取值,而且for循环会捕捉StopIteration异常,以终止迭代

6.生成器:可以理解为一种数据类型,这种数据类型自动实现了迭代器协议(其他的数据类型需要调用自己内置的__iter__方法),所以生成器就是可迭代对象

7.可以理解为一种数据类型,这种数据类型自动实现了迭代器协议(其他的数据类型需要调用自己内置的__iter__方法),所以生成器就是可迭代对象

8.为何使用生成器之生成器的优点

Python使用生成器对延迟操作提供了支持。所谓延迟操作,是指在需要的时候才产生结果,而不是立即产生结果。这也是生成器的主要好处。

9.生成器小结:

1).是可迭代对象

2).实现了延迟计算,省内存啊

3).生成器本质和其他的数据类型一样,都是实现了迭代器协议,只不过生成器附加了一个延迟计算省内存的好处,其余的可迭代对象可没有这点好处

 

posted @ 2017-06-19 23:54  申不二  阅读(251)  评论(0编辑  收藏  举报