14. 迭代器、生成器、模块与包、json模块

1.迭代器

1.1 迭代器介绍

迭代器是用来迭代取值的工具

每一次迭代得到的结果会作为下一次迭代的初始值,单纯的重复并不是迭代

# while循环实现迭代取值
a = [1, 2, 3, 4, 5, 6]
index = 0
while index < len(a):
    print(a[index])
    index += 1

1.2 可迭代对象

内置有_ _iter_ _方法的对象都是可迭代对象

# 字符串 是可迭代对象
a = 'messi'
print(a.__iter__())  # <str_iterator object at 0x000001E100A5A740>
# 整数、浮点数、布尔值   不是可迭代对象
print(1.__iter__)  # invalid decimal literal
print(2.3.__iter__)
print(True.__iter__)
# 列表、元组、字典、集合都是可迭代对象
print([1, 2, 3].__iter__())
print((4, 5, 6).__iter__())
print({1: 'one', 2: 'two', 3: 'three'}.__iter__())
print({7, 8, 9}.__iter__())

1.3 迭代器对象

在可迭代对象的基础上具有_ _next_ _方法的对象

即同时具有_ _ iter_ _和_ _ next_ _方法的对象就是迭代器对象

a = 'messi'.__iter__()  # 先用__iter__方法生成一个可迭代对象，再使用可迭代对象逐步取值
print(a.__next__())  # m
print(a.__next__())  # e
print(a.__next__())  # s
print(a.__next__())  # s
print(a.__next__())  # i
# print(a.__next__())  # 超过数量时会报错
a = 'messi'.__iter__()  # 超过数量时，再次迭代同个对象，只能重新调用iter方法创建一个新的迭代器对象
print(a.__next__())  # m

# 列表、元组、字典、集合都是迭代器对象
print([1, 2, 3].__iter__().__next__())  # 1
print((4, 5, 6).__iter__().__next__())  # 4
print({1: 'one', 2: 'two', 3: 'three'}.__iter__().__next__())  # 1
print({'j', 'q', 'k'}.__iter__().__next__())  # k

2. 生成器

2.1 概念

生成器是一种特殊的迭代器，可以在需要时生成数据，而不必提前从内存中生成并存储整个数据集

通过生成器，可以逐个生成序列中的元素，无需一次性生成整个序列

生成器在处理大数据集时，具有节省内存、提高效率的优点

print(range(10))  # range(0, 10)

2.2 生成器的创建方式

2.2.1 列表推导式

使用列表推导式时，将列表推导式的方括号改为圆括号，即可创建一个生成器

# 将列表改为元组，看起来像元组推导式，其实是一个生成器对象
a = (b * 3 for b in range(5))
print(a)  # <generator object <genexpr> at 0x00000201A76793F0>

print(next(a))  # 0
print(next(a))  # 3
print(next(a))  # 6
print(next(a))  # 9
print(next(a))  # 12
print(next(a))  # 超过数量时仍然会报错

2.2.2 使用关键字yield

(1)概念

使用yield关键字定义一个生成器函数时，生成器函数中的yield语句会暂停函数执行并返回一个值，下一次调用该函数时会继续执行并返回下一个值。

yield返回一个值的用法与return用法类似。

def f1():
    yield 1
    print(666)
    yield 2
    yield 3

r = f1()
print(r)  # <generator object f1 at 0x000001C41BC293F0>
print(next(r))  # 1
print(next(r))  # 666
                # 2

在上面的代码中，f1()是一个生成器函数，通过yield关键字逐个生成值

在调用该函数时，会得到一个生成器对象

调用next()函数，可以逐个返回生成器中的值

（2）yield的应用

# 在函数内可以采用表达式形式的yield
def eater():
    print('开始吃饭')
    while True:
        food = yield
        print(f'端上桌的是{food}')

# 可以拿到函数的生成器对象持续为函数体send值，以上整个代码为生成器函数
a = eater()  # 得到生成器对象
print(type(a), a)  # <class 'generator'> <generator object eater at 0x0000021D758993F0>
# 需要先'初始化'(启动)一次函数，让函数暂停在food = yield,等待调用a.send()方法为其传值
a.send(None)  # 等同于next(a)
# 开始吃饭  暂停在food = yield，因此会打印
a.send('potato')
a.send('fish')

使用装饰器完成生成器对象创建和函数初始化

def init(func):
    def inner(*args, **kwargs):
        g = func(*args, **kwargs)  # 创建生成器对象
        next(g)  # 函数初始化，暂停在food = yield位置
        return g  # 将生成器对象返回出去
    return inner

@init
def eater():
    print('开始吃饭')
    while True:
        food = yield
        print(f'端上桌的是{food}')

# eater()  相当于inner()，拿到的是已经生成并且暂停在food = yield的生成器对象g
# 将上面eater()赋值给变量名，变量名send方法往生成器对象传值
a = eater()  # 开始吃饭
a.send('potato')  # 端上桌的是potato
a.send('fish')  # 端上桌的是fish

3. for循环原理

def circle(start, end, step=1):
    while start < end:
        yield start
        start += step

a = circle(1, 5)  # 得到一个生成器对象a
print(next(a))  # 第一次执行next，调用函数，开始循环，start初始值为1，遇到yield函数暂停并将值返回
print(next(a))  # 第二次执行next，执行yield下一行的赋值语句，开始下一次循环，遇到yield函数暂停并将值返回
print(next(a))
print(next(a))
print(next(a))  # 超过个数将报错，了解类的知识再解决报错问题

for循环内部原理：

把关键字in后面的数据类型转换为了迭代器iter

循环next取值

next取值完毕后进行下一次next会报错，自动处理错误并且结束while循环

4. 模块

4.1 模块介绍

概念：

在python中，一个py文件就是一个模块，文件名aaa.py则模块名是aaa

模块的来源：

内置的：python解释器自带，如os、random

第三方的：开发者写好的模块，需要先下载再使用 pandas、requests

自定义的：程序员自己开发的模块

模块的存在形式：

一个py文件就是一个模块

一系列py文件的集合就是一个包

4.2 模块的使用

准备：新建一个文件foo.py

（1）直接导入

要想在另外一个 py 文件中引用foo.py中的功能
需要使用 import foo
首次导入模块会做三件事：
执行源文件代码
产生一个新的名称空间用于存放源文件执行过程中产生的名字
在当前执行文件所在的名称空间中得到一个名字 foo，该名字指向新创建的模块名称空间
若要引用模块名称空间中的名字，需要加上该前缀

import导入模块方式：
用import语句导入多个模块，可以写多行import语句
import module1
import module2
...
import moduleN

还可以在一行导入，用逗号分隔开不同的模块
import module1,module2,...,moduleN

（2）详细导入

from 模块位置 import 模块名：

使用import foo导入模块后，引用模块中的名字都需要加上foo.作为前缀
而使用from foo import x,get,change,Foo则可以在当前执行文件中直接引用模块foo中的名字

导入所有：

from语句支持 from foo import *语法， * 代表将foo中所有的名字都导入到当前位置

只能在模块最顶层使用 * 的方式导入，在函数内则非法

模块重命名：

from ... import ... as ... 语句

5. 包

模块是单独的py文件，一系列功能的集合体

包是模块加上_ _ init_ _.py的文件夹，是模块的集合体

5.1 创建包语法

（1）自动创建

在pycharm的文件夹上右键选择新建---python package

自动创建一个文件夹，并且当前文件夹中会自带一个_ _init_ _.py文件

（2）手动创建

创建一个文件夹，然后在当前的文件夹中创建一个_ _init_ _.py文件

5.2 使用包

（1）详细导入

详细导入语法从指定包下面的模块中导入相应的方法
from control.Add import add
from control.multy import multy

（2）包内注册模块

_ _init_ _.py可以注册当前包下面的所有模块和功能

from control import add,multy

在加载带有_ _init_ _.py的包的时候

自动加载_ _ init_ _.py文件里面的所有代码

5.3 相对路径/绝对路径

相对路径相对于当前文件夹来说的路径

绝对路径相对于当前盘符来说的路径

. 当前目录

.. 上一级目录

6. json模块

以前存储文件时用的时text文本存储用户数据，文本只能切分和存储字符串数据，python中的字典对于字符串来说不行，所以就有一个比较普遍的存储文件的方式json

import json

a = {'name': 'messi', 'age': 37, 'club': 'miami', 'address': 'usa'}

# 将源数据转换为json字符串
b = json.dumps(a)
print(b, type(b))  # {"name": "messi", "age": 37, "club": "miami", "address": "usa"} <class 'str'>

# 将json字符串转换为源数据
c = json.loads(b)
print(c, type(c))  # {'name': 'messi', 'age': 37, 'club': 'miami', 'address': 'usa'} <class 'dict'>

# 将源数据写入到json文件中
with open('new.json', 'w', encoding='utf-8') as f:
    json.dump(a, f, ensure_ascii=False)

# 将json文件的数据转换成源数据
with open('new.json', 'r', encoding='utf-8') as f2:
    data = json.load(f2)
print(data, type(data))  # {'name': 'messi', 'age': 37, 'club': 'miami', 'address': 'usa'} <class 'dict'>

posted @ 2024-07-31 21:50 hbutmeng 阅读(3) 评论(0) 编辑收藏举报

刷新页面返回顶部

hbutmeng