Python 迭代器与生成器
[TOC]
一、迭代器与生成器的概念
迭代器(Iterator)和生成器(Generator)在 Python 中都用于处理序列数据,但它们有一些重要的区别。以下是迭代器和生成器的主要区别:
迭代器(Iterator)
(1)定义方式:迭代器是一个实现了 `__iter__()` 和 `__next__()` 方法的对象。`__iter__()` 方法返回迭代器对象自身,而 `__next__()` 方法用于返回序列中的下一个元素。
(2)状态:迭代器维护了一个内部状态,用于记录序列中当前位置的元素。每次调用 `__next__()` 方法时,迭代器会返回下一个元素,并更新其内部状态。
(3)使用方式:可以通过内置函数 `iter()` 创建迭代器对象,然后使用 `next()` 函数逐个获取序列中的元素。
生成器(Generator)
(1)定义方式:生成器是通过函数中包含 `yield` 关键字定义的。当调用生成器函数时,它返回一个迭代器对象,每次执行 `yield` 语句时都会暂停函数的执行并返回一个值。
(2)状态:生成器函数执行时会保留局部变量的状态,使得在每次调用 `next()` 方法时都能够从上次的执行点继续执行。
(3)单向:生成器是单向的,只能按照定义的顺序前进,不支持回退。一旦生成器函数执行完毕,再次调用 `next()` 将引发 `StopIteration` 异常。
(4)使用方式:生成器可以使用函数的方式定义,通过 `yield` 返回值,而不是一次性生成整个序列。可以使用 `for` 循环或 `next()` 函数逐个获取生成器的值。
共同点
(1)按需生成值:迭代器和生成器都是按需生成值的,可以在需要时逐个获取元素,而不是一次性生成整个序列。
(2)用于循环结构:迭代器和生成器都可以被用于 `for` 循环结构,使得处理序列数据更加方便。
(3)节省内存:由于按需生成,迭代器和生成器在处理大型数据集时可以节省内存。
综合而言,迭代器和生成器都是处理序列数据的强大工具,选择使用哪个取决于具体的需求和代码结构。
二、使用案例
2.1 迭代器
迭代是 Python 最强大的功能之一,是访问集合元素的一种方式。。
迭代器是一个可以记住遍历的位置的对象。
迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。
迭代器有两个基本的方法:iter() 和 next()。
字符串,列表或元组对象都可用于创建迭代器:
>>> list=[1,2,3,4]
>>> it = iter(list) # 创建迭代器对象
>>> print (next(it)) # 输出迭代器的下一个元素
1
>>> print (next(it))
2
>>>
迭代器对象可以使用常规 for 语句进行遍历:
#!/usr/bin/python3
list=[1,2,3,4]
it = iter(list) # 创建迭代器对象
for x in it:
print (x, end=" ")
执行以上程序,输出结果如下:
1 2 3 4
也可以使用 next() 函数:
#!/usr/bin/python3
import sys # 引入 sys 模块
list=[1,2,3,4]
it = iter(list) # 创建迭代器对象
while True:
try:
print (next(it))
except StopIteration:
sys.exit()
执行以上程序,输出结果如下:
1
2
3
4
2.2 生成器
在 Python 中,使用了 yield 的函数被称为生成器(generator)。
跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器。
在调用生成器运行的过程中,每次遇到 yield 时函数会暂停并保存当前所有的运行信息,返回 yield 的值。并在下一次执行 next() 方法时从当前位置继续运行。
以下实例使用 yield 实现斐波那契数列:
#!/usr/bin/python3
import sys
def fibonacci(n): # 生成器函数 - 斐波那契
a, b, counter = 0, 1, 0
while True:
if (counter > n):
return
yield a
a, b = b, a + b
counter += 1
f = fibonacci(10) # f 是一个迭代器,由生成器返回生成
while True:
try:
print (next(f), end=" ")
except StopIteration:
sys.exit()
执行以上程序,输出结果如下:
0 1 1 2 3 5 8 13 21 34 55
三、使用场景
3.1 使用生成器的场景
大数据集处理: 当处理大量数据时,生成器允许按需生成数据,而不需要一次性将所有数据加载到内存中。这对于内存敏感的应用程序非常有用。
惰性计算: 如果你有一个计算密集型的操作,但只有在需要结果时才进行计算,生成器可以提供惰性计算的特性,避免不必要的计算开销。
无限序列: 生成器可以轻松地表示无限序列,因为它们按需生成数据。这对于模拟、数学计算和其他需要无限序列的场景非常有用。
协程和异步编程: 生成器可以用作协程的基础,用于异步编程中。asyncio
模块中就使用了异步生成器。
状态机: 生成器可以方便地实现状态机,使得在状态之间切换更加直观和简单。
3.2 使用迭代器的场景
按顺序访问集合元素: 迭代器是按需提供下一个元素的序列对象,适合在循环中按顺序访问集合元素。
遍历大型数据结构: 当处理大型数据结构时,使用迭代器可以逐个获取元素,而不需要一次性加载整个数据结构。
自定义容器类: 实现迭代器接口的类可以自定义容器,使得对象能够被 for
循环等结构遍历。
惰性计算: 迭代器也支持惰性计算,它们在需要时生成下一个元素,而不提前生成整个序列。
无需记住索引: 使用迭代器时,不需要显式地使用索引来访问元素,这使得代码更加简洁和易读。