Python 迭代器与生成器

[TOC]

一、迭代器与生成器的概念

​ 迭代器(Iterator)和生成器(Generator)在 Python 中都用于处理序列数据,但它们有一些重要的区别。以下是迭代器和生成器的主要区别:

迭代器(Iterator)

(1)定义方式:迭代器是一个实现了 `__iter__()` 和 `__next__()` 方法的对象。`__iter__()` 方法返回迭代器对象自身,而 `__next__()` 方法用于返回序列中的下一个元素。
(2)状态:迭代器维护了一个内部状态,用于记录序列中当前位置的元素。每次调用 `__next__()` 方法时,迭代器会返回下一个元素,并更新其内部状态。
(3)使用方式:可以通过内置函数 `iter()` 创建迭代器对象,然后使用 `next()` 函数逐个获取序列中的元素。

生成器(Generator)

(1)定义方式:生成器是通过函数中包含 `yield` 关键字定义的。当调用生成器函数时,它返回一个迭代器对象,每次执行 `yield` 语句时都会暂停函数的执行并返回一个值。
(2)状态:生成器函数执行时会保留局部变量的状态,使得在每次调用 `next()` 方法时都能够从上次的执行点继续执行。
(3)单向:生成器是单向的,只能按照定义的顺序前进,不支持回退。一旦生成器函数执行完毕,再次调用 `next()` 将引发 `StopIteration` 异常。
(4)使用方式:生成器可以使用函数的方式定义,通过 `yield` 返回值,而不是一次性生成整个序列。可以使用 `for` 循环或 `next()` 函数逐个获取生成器的值。

共同点

(1)按需生成值:迭代器和生成器都是按需生成值的,可以在需要时逐个获取元素,而不是一次性生成整个序列。
(2)用于循环结构:迭代器和生成器都可以被用于 `for` 循环结构,使得处理序列数据更加方便。
(3)节省内存:由于按需生成,迭代器和生成器在处理大型数据集时可以节省内存。

综合而言,迭代器和生成器都是处理序列数据的强大工具,选择使用哪个取决于具体的需求和代码结构。

二、使用案例

2.1 迭代器

迭代是 Python 最强大的功能之一,是访问集合元素的一种方式。。

迭代器是一个可以记住遍历的位置的对象。

迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。

迭代器有两个基本的方法:iter()next()

字符串,列表或元组对象都可用于创建迭代器:

>>> list=[1,2,3,4]
>>> it = iter(list)    # 创建迭代器对象
>>> print (next(it))   # 输出迭代器的下一个元素
1
>>> print (next(it))
2
>>> 

迭代器对象可以使用常规 for 语句进行遍历:

#!/usr/bin/python3

list=[1,2,3,4]
it = iter(list)    # 创建迭代器对象
for x in it:
    print (x, end=" ")

执行以上程序,输出结果如下:

1 2 3 4

也可以使用 next() 函数:

#!/usr/bin/python3

import sys         # 引入 sys 模块

list=[1,2,3,4]
it = iter(list)    # 创建迭代器对象

while True:
    try:
        print (next(it))
    except StopIteration:
        sys.exit()

执行以上程序,输出结果如下:

1
2
3
4

2.2 生成器

在 Python 中,使用了 yield 的函数被称为生成器(generator)。

跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器。

在调用生成器运行的过程中,每次遇到 yield 时函数会暂停并保存当前所有的运行信息,返回 yield 的值。并在下一次执行 next() 方法时从当前位置继续运行。

以下实例使用 yield 实现斐波那契数列:

#!/usr/bin/python3

import sys

def fibonacci(n): # 生成器函数 - 斐波那契
    a, b, counter = 0, 1, 0
    while True:
        if (counter > n): 
            return
        yield a
        a, b = b, a + b
        counter += 1
f = fibonacci(10) # f 是一个迭代器,由生成器返回生成

while True:
    try:
        print (next(f), end=" ")
    except StopIteration:
        sys.exit()

执行以上程序,输出结果如下:

0 1 1 2 3 5 8 13 21 34 55

三、使用场景

3.1 使用生成器的场景

大数据集处理: 当处理大量数据时,生成器允许按需生成数据,而不需要一次性将所有数据加载到内存中。这对于内存敏感的应用程序非常有用。
惰性计算: 如果你有一个计算密集型的操作,但只有在需要结果时才进行计算,生成器可以提供惰性计算的特性,避免不必要的计算开销。
无限序列: 生成器可以轻松地表示无限序列,因为它们按需生成数据。这对于模拟、数学计算和其他需要无限序列的场景非常有用。
协程和异步编程: 生成器可以用作协程的基础,用于异步编程中。asyncio 模块中就使用了异步生成器。
状态机: 生成器可以方便地实现状态机,使得在状态之间切换更加直观和简单。

3.2 使用迭代器的场景

按顺序访问集合元素: 迭代器是按需提供下一个元素的序列对象,适合在循环中按顺序访问集合元素。
遍历大型数据结构: 当处理大型数据结构时,使用迭代器可以逐个获取元素,而不需要一次性加载整个数据结构。
自定义容器类: 实现迭代器接口的类可以自定义容器,使得对象能够被 for 循环等结构遍历。
惰性计算: 迭代器也支持惰性计算,它们在需要时生成下一个元素,而不提前生成整个序列。
无需记住索引: 使用迭代器时,不需要显式地使用索引来访问元素,这使得代码更加简洁和易读。

posted @ 2023-12-22 12:16  善战者求之于势  阅读(48)  评论(0编辑  收藏  举报