【八】并发编程之异步编程
- 基于 async 和 await 关键字的协程可以实现异步编程,这也是目前 Python 异步相关的主流技术。在这里我们主要介绍一下实现异步的模块:asyncio 模块
【一】asyncio 模块
- asyncio 模块是 Python 中实现异步的一个模块,该模块在 Python3.4 的时候发布,async 和 await 关键字在 Python3.5 中引入。因此,想要使用asyncio模块,建议 Python 解释器的版本不要低于 Python3.5 。
【二】事件循环
所谓的事件循环,我们可以把它当作是一个 while 循环,这个 while 循环在循环生命周期内运行并执行一些任务,在特定的条件下结束循环。
在编写程序的时候可以通过如下代码来获取和创建事件循环:
import asyncio
loop = asyncio.get_event_loop()
【三】协程 & 异步编程
- 首先我们来看一下 协程函数
- 什么是协程函数呢?
- 直白的讲,定义为如下形式的函数
- 我们可以称之为协程函数,如下代码所示:
async def fn():
pass
- 知道了什么是协程函数
- 接下来我们再来看一下什么是协程对象
- 所谓的协程对象就是调用协程函数之后返回的对象
- 我们称之为 协程对象,如下代码所示:
res = fn()
注意事项:调用协程函数时,函数内部的代码不会执行,只是会返回一个协程对象!
【1】基本应用
- 在编写程序的时候,如果想要执行协程函数内部的代码,通过 函数名() 调用函数是不可以的,需要 事件循环 和 协程对象 配合才能实现,如下代码所示:
import asyncio
async def fn():
print('协程函数内部的代码')
def main():
# 调用协程函数,返回一个协程对象
res = fn()
# 执行协程代码的方式一
# todo:1、创建一个事件循环
# loop = asyncio.get_event_loop()
# todo:2、将协程当作任务提交到事件循环的任务列表中,协程执行完成之后终止
# loop.run_until_complete(res)
# 执行协程代码的方式二
# 解析:第二种方式在本质上和第一种方式是相同的,其内部先创建事件循环,然后执行 run_until_complete
# 但是要注意:该方式只支持 Python3.7+ 的解释器,因为该方式在 Python3.7 加入的。
asyncio.run(res)
if __name__ == '__main__':
main()
- 这个过程可以简单理解为:
- 将 协程函数 当做任务添加到 事件循环 的任务列表
- 然后事件循环检测列表中的协程函数 是否已准备就绪(默认可理解为就绪状态)
- 如果准备就绪则执行其内部代码。
【2】await
await 是一个 只能 在协程函数中使用的关键字,用于当协程函数遇到IO操作的时候挂起当前协程(任务),当前协程挂起过程中,事件循环可以去执行其他的协程(任务),当前协程IO处理完成时,可以再次切换回来执行 await 之后的代码,怎么理解呢?请看如下代码:
实例1
import asyncio
async def fn():
print('协程函数内部的代码')
# 遇到IO操作之后挂起当前协程(任务),等IO操作完成之后再继续往下执行。
# 当前协程挂起时,事件循环可以去执行其他协程(任务)
response = await asyncio.sleep(2) # 模拟遇到了IO操作
print(f'IO请求结束,结果为:{response}')
def main():
# 调用协程函数,返回一个协程对象
res = fn()
# 执行协程函数
asyncio.run(res)
if __name__ == '__main__':
main()
'''
运行结果:
协程函数内部的代码
IO请求结束,结果为:None
'''
实例2
import asyncio
async def other_tasks():
print('start')
await asyncio.sleep(2) # 模拟遇到了IO操作
print('end')
return '返回值'
async def fn():
print('协程函数内部的代码')
# 遇到IO操作之后挂起当前协程(任务),等IO操作完成之后再继续往下执行。
# 当前协程挂起时,事件循环可以去执行其他协程(任务)
response = await other_tasks() # 模拟执行其他协程任务
print(f'IO请求结束,结果为:{response}')
def main():
# 调用协程函数,返回一个协程对象
res = fn()
# 执行协程函数
asyncio.run(res)
if __name__ == '__main__':
main()
'''
运行结果:
协程函数内部的代码
start
end
IO请求结束,结果为:返回值
'''
实例3
import asyncio
async def other_tasks():
print('start')
await asyncio.sleep(2) # 模拟遇到了IO操作
print('end')
return '返回值'
async def fn():
print('协程函数内部的代码')
# 遇到IO操作之后挂起当前协程(任务),等IO操作完成之后再继续往下执行。
# 当前协程挂起时,事件循环可以去执行其他协程(任务)
respnse1 = await other_tasks()
print(f'IO请求结束,结果为:{respnse1}')
respnse2 = await other_tasks()
print(f'IO请求结束,结果为:{respnse2}')
def main():
# 调用协程函数,返回一个协程对象
cor_obj = fn()
# 执行协程函数
asyncio.run(cor_obj)
if __name__ == '__main__':
main()
'''
运行结果:
协程函数内部的代码
start
end
IO请求结束,结果为:返回值
start
end
IO请求结束,结果为:返回值
'''
- 上述的所有实例都只是创建了一个任务
- 即:事件循环的任务列表中只有一个任务
- 所以在IO等待时无法演示切换到其他任务效果。
- 在程序中想要创建多个任务对象
- 需要使用Task对象来实现。
【3】Task 对象
Tasks 用于并发调度协程
通过 asyncio.create_task(协程对象) 的方式创建 Task 对象
这样可以让协程加入事件循环中等待被调度执行。
除了使用 asyncio.create_task() 函数以外
还可以用低层级的loop.create_task() 或 ensure_future() 函数。并且不建议手动实例化 Task 对象。
本质上是将协程对象封装成 Task 对象
并将协程立即加入事件循环,同时追踪协程的状态。
注意事项:
asyncio.create_task() 函数在 Python3.7 中被加入。
在 Python3.7 之前,可以改用低层级的
asyncio.ensure_future() 函数。
实例1
import asyncio
async def other_tasks():
print('start')
await asyncio.sleep(2) # 模拟遇到了IO操作
print('end')
return '返回值'
async def fn():
print('fn开始')
# 创建协程,将协程封装到一个Task对象中并立即添加到事件循环的任务列表中,等待事件循环去执行(默认是就绪状态)。
task1 = asyncio.create_task(other_tasks())
# 创建协程,将协程封装到一个Task对象中并立即添加到事件循环的任务列表中,等待事件循环去执行(默认是就绪状态)。
task2 = asyncio.create_task(other_tasks())
print('fn结束')
# 当执行某协程遇到IO操作时,会自动化切换执行其他任务。
# 此处的await是等待相对应的协程全都执行完毕并获取结果
response1 = await task1
response2 = await task2
print(response1, response2)
def main():
asyncio.run(fn())
if __name__ == '__main__':
main()
'''
运行结果:
fn开始
fn结束
start
start
end
end
返回值 返回值
'''
实例2
import asyncio
async def other_tasks():
print('start')
await asyncio.sleep(2) # 模拟遇到了IO操作
print('end')
return '返回值'
async def fn():
print('fn开始')
# 创建协程,将协程封装到一个Task对象中并立即添加到事件循环的任务列表中,等待事件循环去执行(默认是就绪状态)。
task_lis = [
asyncio.create_task(other_tasks()),
asyncio.create_task(other_tasks()),
]
print('fn结束')
# 当执行某协程遇到IO操作时,会自动化切换执行其他任务。
# 此处的await是等待所有协程执行完毕,并将所有协程的返回值保存到done
# 如果设置了timeout值,则意味着此处最多等待的秒,完成的协程返回值写入到done中,未完成则写到pending中。
done, pending = await asyncio.wait(task_lis, timeout=None)
print(done)
print(pending)
def main():
asyncio.run(fn())
if __name__ == '__main__':
main()
'''
运行结果:
fn开始
fn结束
start
start
end
end
{<Task finished name='Task-3' coro=<other_tasks() done, defined at /Users/liumingyang/PycharmProjects/async_test/test.py:4> result='返回值'>, <Task finished name='Task-2' coro=<other_tasks() done, defined at /Users/liumingyang/PycharmProjects/async_test/test.py:4> result='返回值'>}
set()
'''
【4】异步迭代器
1.什么是异步迭代器?
- 实现了 aiter() 和 anext()方法的对象。
- anext 必须返回一个 awaitable 对象。
- async for会处理异步迭代器的 anext()方法所返回的可等待对象,直到其引发一个 StopAsyncIteration异常。
2. 什么是异步可迭代对象?
- 可在 async for语句中被使用的对象。
- 必须通过它的 aiter()方法返回一个 asynchronous iterator 。
import asyncio
class Reader:
""" 自定义异步迭代器(同时也是异步可迭代对象) """
def __init__(self):
self.count = 0
async def readline(self):
self.count += 1
if self.count == 100:
return None
return self.count
def __aiter__(self):
return self
async def __anext__(self):
val = await self.readline()
if val is None:
raise StopAsyncIteration
return val
async def fn():
# 创建异步可迭代对象
async_iter = Reader()
# async for 必须放在async def 函数内,否则语法错误。
async for item in async_iter:
print(item)
asyncio.run((fn()))
【5】异步上下文管理器
- 此种对象通过定义 aenter*()* 和 aexit*()* 方法来对 async with 语句中的环境进行控制。
import asyncio
class AsyncContextManager:
def __init__(self):
self.conn = None
async def do_something(self):
# 异步操作数据库
return 123
async def __aenter__(self):
# 异步链接数据库
self.conn = await asyncio.sleep(1)
return self
async def __aexit__(self, exc_type, exc_val, exc_tb):
# 异步关闭数据库链接
await asyncio.sleep(1)
async def fn():
async with AsyncContextManager() as f:
res = await f.do_something()
print(res)
asyncio.run(fn())
【6】小结
- 在程序中只要看到 async 和 await 关键字
- 其内部就是基于协程实现的异步编程
- 这种异步编程是通过一个线程在IO等待时间去执行其他任务,从而实现并发。
以上就是异步编程的常见操作,更多内容请参考 Python 官方文档:https://docs.python.org/zh-cn/3.8/library/asyncio.html
【四】小试牛刀
- 需求:访问苹果官网 50 次,测试其总访问时间。
- 同步版本
import time
import requests
def calc_visit_time(url):
"""
计算程序的执行时间**
:param url:
:return:
"""
start_time = time.time()
for times in range(1, 51):
response = requests.get(url=url)
if response.status_code == 200:
print(f'第【{times}】次链接成功!')
else:
print(f'链接失败!'.center(50, '-'))
end_time = time.time()
print(f'任务消耗了{end_time - start_time:.2f}秒的时间!')
def** main():
calc_visit_time('https://www.apple.com.cn')
if __name__ == '__main__':
main()
'''
运行结果:
第【1】次链接成功!
第【2】次链接成功!
第【3】次链接成功!
第【4】次链接成功!
第【5】次链接成功!
...
第【46】次链接成功!
第【47】次链接成功!
第【48】次链接成功!
第【49】次链接成功!
第【50】次链接成功!
任务消耗了5.65秒的时间!
'''
异步版本
import asyncio
import time
import aiohttp
async def fetch_async(url):
"""
异步的aiohttp模块,替代了之前的同步的requests模块
:param url:
:return:
"""
async with aiohttp.ClientSession() as session:
async with session.get(url=url) as response:
if response.status == 200:
print(f'链接成功!')
else:
print(f'链接失败!'.center(50, '-'))
async def calc_visit_time(url):
"""
计算程序的执行时间
:param url:
:return:
"""
start_time = time.time()
task_lis = []
for _ in range(50):
task_lis.append(fetch_async(url))
await asyncio.gather(*task_lis)
end_time = time.time()
print(f'任务消耗了{end_time - start_time:.2f}秒的时间!')
def main():
asyncio.run(calc_visit_time('https://www.apple.com.cn'))
if __name__ == '__main__':
main()
'''
运行结果:
链接成功!
链接成功!
链接成功!
链接成功!
链接成功!
...
链接成功!
链接成功!
链接成功!
链接成功!
链接成功!
任务消耗了0.31秒的时间!
'''
- 通过上述两个实例的运行结果,我们可以看到,使用了异步之后,其效率提升18倍。
本文来自博客园,作者:Chimengmeng,转载请注明原文链接:https://www.cnblogs.com/dream-ze/p/17502061.html