迭代器、可迭代对象与生成器

Iterator 与 gerater的作用是优化内存,当处理大文件,大数据的时候可以使用。

  1. 对大列表进行优化

  2. 大文件的优化

一、基本概念

迭代器:  一种数据类型,用来处理大数据

可迭代对象:一个对象,能每次返回数据组中的一个成员,for循环中每次返回一个数据或者用来作为iter内置函数的参数,返回迭代器对象

生成器:  生成器是通过yield 或 生成器表达式,用一种比较方便的方式生成了迭代器。

二、代码视线部分

2.1  yield 

 yield函数就是一个生成器:

yield的作用:

  1. 相当于return返回一个值

  2. 记住该位置,下次进来从这个位置开始。

两种使用方式:

1. 使用next 和 send 需结合异常处理(当超出最大值的时候,会报错)

2. 使用for循环,for内部自动帮我们处理异常

def ge():
    yield 8
    yield 88
    yield 888

g = ge()
print(next(g))
print(next(g))
print(next(g))
print(next(g))  # 报错,超出

使用for处理

def gen_num2():
    for i in range(8):  # range是一个惰性机制。
        yield i

for i in gen_num2():
    print(i)

 

2.2 迭代器,可迭代对象,生成器的类型判断

from collections import Iterator, Iterable, Generator

# 列表的类型判断
li = [1, 2, 3, 4]
print(isinstance(li, Iterable))  # True
print(isinstance(li, Iterator))  # False
print(isinstance(li, Generator)) # False

# 字典的类型判读
dic = {'name':'hui', 'age':18}
print(isinstance(dic, Iterable))  # True
print(isinstance(dic, Iterator))  # False
print(isinstance(dic, Generator)) # False

# range的类型判断
# range是一个可迭代对象,不是迭代器。但是他跟迭代器有类似的地方,又一个惰性机制,所有也很节约内存
r = range(10)
print(type(r))
print(isinstance(r, Iterable))  # True
print(isinstance(r, Iterator))  # False
print(isinstance(r, Generator))  # False

# 文件对象 是一个迭代器
with open('1.txt', 'wb') as f:
    pass
print(isinstance(f, Iterable))   # True
print(isinstance(f, Iterator))   # True
print(isinstance(f, Generator))  # False

# yield对象
def ge():
    for i in range(9):
        yield(i)
g = ge()
print(isinstance(g, Iterable))   # True
print(isinstance(g, Iterator))   # True
print(isinstance(g, Generator))  # False

2.3 可迭代对象转换为迭代器,优化内存

  使用iter内置函数

from collections import Generator, Iterable, Iterator

x = [x for x in range(10)]
y = iter(x)     # 列表转换为迭代器
print(next(y))
print(next(y))
print(next(y))
print(next(y))
print(isinstance(y, Iterable)) 
print(isinstance(y, Iterator))  # 是迭代器对象,
print(isinstance(y, Generator))

dic = {'name':'hui', 'age':18}
print(isinstance(dic, Iterable))
print(isinstance(dic, Iterator))
print(isinstance(dic, Generator))

d = iter(dic)  # 字典转换为迭代器
print(type(d))
print(isinstance(d, Iterable))
print(isinstance(d, Iterator))   
print(isinstance(d, Generator)) 

 

2.4 生成器表达式

# 列表表达式
y = [x for x in range(10)]

# 生成器表达式
z = (x for x in range(10))
print(type(z), z)

 

2.5 大文件 与 函数优化

1. 函数优化

# 斐波那契
# 0,1,1,2,3
def fb(n):
    a, b = 0, 1
    while a < n:
        print(a)
        a,b = b, a+b

def fb_list(n):
    a, b = 0, 1
    fblist = []
    while a < n:
        fblist.append(a)  # 当数据量非常大的时候,就会造成内存爆炸
        a, b = b, a+b
    return fblist

print(fb_list(1000))

def fb_ge(n):
    a, b = 0, 1
    fblist = []
    while a < n:
        yield a         # 使用生成器每次来取,优化内存
        a, b = b, a+b

for i in fb_ge(1000):
    print(i, end=' ')

2. 大文件优化

  打开文件的对象,本身就是一个迭代器。

with open('1.txt', 'wb') as f:
    pass
print(isinstance(f, Iterable))   # True
print(isinstance(f, Iterator))   # True
print(isinstance(f, Generator))  # False

 

 

 
posted @ 2018-07-28 12:36  娄先生  阅读(201)  评论(0编辑  收藏  举报
levels of contents