python异步编程
https://www.ddpool.cn/article/51930.html
fastapi理解:https://www.jianshu.com/p/66bb458ac530
PS:
因为GIL的存在,所以Python的多线程在CPU密集的任务下显得无力,但是对于IO密集的任务,多线程还是足以发挥多线程的优势的,而异步也是为了应对IO密集的任务,所以两者是一个可以相互替代的方案,因为设计的不同,理论上异步要比多线程快,因为异步的花销更少, 因为不需要额外系统申请额外的内存,而线程的创建跟系统有关,需要分配一定量的内存,一般是几兆,比如linux默认是8MB
1.概念
python提供了asyncio模块来支持异步编程,其中涉及到coroutines
、event loops
、futures
三个重要概念
coroutines(字面意思:协程):
是一个可以在执行中暂停并切换到event loops执行流程的特殊类型的函数
event loops:
事件循环
1.2不同python版本的几种写法
-
python3.5及其以上(如4.3写法)
loop = asyncio.get_event_loop() loop.run_until_complete(协程对象或者task列表)
-
python3.7及其以上
asyncio.run(一般是主协程函数对象)
2.协程
协程(Coroutine),可称为微线程,是一种用户态内的上下文切换技术,其实就是通过一个线程来是实现代码块的相互切换执行。
实现协程的几种方法:
- greenlet,早期模块
- yield关键词
- asyncio装饰器(python3.4)
- async、await关键字(python3.5)
2.1 greenlet
from greenlet import greenlet
def func():
print(1)
gr2.switch()
print(2)
gr2.switch()
def func2():
print(3)
gr1.switch()
print(4)
gr1 = greenlet(func)
gr2 = greenlet(func2)
gr1.switch()
执行结果:1,3,2,4
2.2 yield
通过生成器实现切换,很少用
def func1():
yield 1
yield from func2()
yield 2
def func2():
yield 3
yield 4
f1 = func1()
for item in f1:
print(item)
2.3 asyncio
上面两种都是手动,此处是自动,python3.4之后的版本通过装饰器来实现,遇到io自动切换。
协程是带有装饰器的函数,将其加入tasks中,再将tasks加入loop事件循环中。
import asyncio
@asyncio.coroutine
def func1():
print(1)
yield from asyncio.sleep(2)
print(2)
@asyncio.coroutine
def func2():
print(3)
yield from asyncio.sleep(2)
print(4)
tasks = [
asyncio.ensure_future(func1()),
asyncio.ensure_future(func2())
]
loop = asyncio.get_event_loop()
loop.run_until_complete(asyncio.wait(tasks))
2.4 async & await关键字
python3.5版本之后,和上一步实现逻辑一样
import asyncio
async def func1():
print(1)
await asyncio.sleep(2)
print(2)
async def func2():
print(3)
await asyncio.sleep(2)
print(4)
tasks = [
asyncio.ensure_future(func1()),
asyncio.ensure_future(func2())
]
loop = asyncio.get_event_loop()
loop.run_until_complete(asyncio.wait(tasks))
3.爬虫例子
aiohttp是异步请求
from asyncio import tasks
from multiprocessing.connection import wait
import aiohttp
import asyncio
async def fetch(session,url):
print("发送请求:",url)
async with session.get(url, verify_ssl=False) as response:
content = await response.content.read()
# file_name = url.rsplit("_")[-1]
file_name = "s.jpg"
with open(file_name,mode='wb') as file_object:
file_object.write(content)
async def main():
async with aiohttp.ClientSession() as session:
url_lst = [
r'https://pic.qqtn.com/up/2017-11/15102069107000700.jpg',
r'https://pic.qqtn.com/up/2017-11/15102069107000700.jpg'
]
tasks = [ asyncio.create_task(fetch(session, url)) for url in url_lst]
await asyncio.wait(tasks)
if __name__ == '__main__':
asyncio.run(main())
4.概念+上手
4.1事件循环
理解为一个死循环,去检测并执行某些代码
任务列表 = [任务1,任务2,任务3...]
while True:
可执行的任务列表,已完成的任务列表 = 去任务列表中检查获取所有的可执行任务,将可执行和已完成的任务返回
for 就绪任务 in 可执行的任务列表:
执行就绪的任务
for 已完成的任务 in 已完成的任务列表:
在任务列表中移除已完成的任务
import asyncio
#去生成或获取一个事件循环
loop = asyncio.get_event_loop()
#将任务列表放进事件循环中
loop.run_until_complete(协程对象)
4.2协程函数+对象
协程函数,定义函数时async def 函数名
协程对象,协程函数()
async def func1():
pass
result = func1()
注意:执行协程函数创建协程对象,函数内部代码不会执行
要想运行协程函数内部代码,必须要加入事件循环
import asyncio
async def func():
print("xxx")
result = func()
#loop = asyncio.get_event_loop()
#loop.run_until_complete( result )
asyncio.run( result ) #python3.7,上面是以前写法
4.3await
await + 可等待的对象(协程对象、Future、Task对象)
示例一:await后只跟对象,事件循环是在协程对象之间来回切换,当await存在,其下方代码会等待await所指向的执行完成之后再执行,因为都在一个函数对象中
import asyncio
async def func():
print('func begin')
await asyncio.sleep(3)
print('func end')
async def main():
print('main begin')
await func()
await func()
print('main end')
if __name__ == '__main__':
loop = asyncio.get_event_loop()
loop.run_until_complete( main() )
主线程中有多个await且后跟协程对象,会依次执行,后跟task对象会并发执行
4.4Task对象
示例一:
import asyncio
async def func():
print(1)
await asyncio.sleep(2)
print(2)
return "返回值"
async def main():
print("main开始")
task1 = asyncio.create_task(func())
task2 = asyncio.create_task(func())
print("main结束")
#此处的await和4.3中含义不一样,此处不会阻塞,但是awati后跟协程对象会阻塞
ret1 = await task1
ret2 = await task2
print(ret1, ret2)
asyncio.run(main())
示例二:
import asyncio
async def func():
print(1)
await asyncio.sleep(2)
print(2)
return "返回值"
async def main():
print("main开始")
task_lst = [
asyncio.create_task(func(),name="n1"), #name为task名称
asyncio.create_task(func(),name="n2")
]
print("main结束")
# 一般timeout设置为None,如果设置的时间内任务没有完成,则只会返回pending(done返回一个集合)
done, pending = await asyncio.wait(task_lst,timeout=None)
print(done)
asyncio.run(main())
示例三:
import asyncio
async def func():
print(1)
await asyncio.sleep(2)
print(2)
return "返回值"
task_lst = [
func(),
func()
]
done,pending = asyncio.run(asyncio.wait(task_lst))
print(done)
4.5asyncio.Future对象
Future的作用时终止loop的循环,task对象继承于它
import asyncio
async def set_after(fut):
await asyncio.sleep(2)
fut.set_result('66')
async def main():
# 获取当前事件循环
loop = asyncio.get_running_loop()
# 创建一个任务(Future对象),没绑定任何行为,则这个任务不知道什么时间结束
fut = loop.create_future()
# 创建一个任务(Task对象),绑定了set_after函数,函数内部会在2s之后给fut赋值
# 即手动设置future任务的最终结果,那么fut就可以结束了
await loop.create_task( set_after( fut))
# 等待Future对象获取最终结果,否则一直等下去
data = await fut
print(data)
asyncio.run(main())
4.6concurrent.futures.Future对象
使用线程池、进程池实现异步操作时要用到的对象
from concurrent.futures import Future
from concurrent.futures.thread import ThreadPoolExecutor
def func(value):
time.sleep(1)
print(value)
pool = ThreadPoolExecutor(max_workers=5)
for i in range(10):
fut = pool.submit(func,i)
print(fut)
什么场景使用协程+线程池
- 当异步协程编程碰到某一个不支持线程、进程、协程的模块时要用到
- 协程操作redis、mysql会有相关支持的模块aioredis、aiomysql,如果其他的数据库没有支持异步的模块,就需要使用协程+进程池、线程池,只是会增加使用一些资源
import time
import asyncio
import concurrent.futures
def func():
# 某个耗时操作
time.sleep(2)
return "xx"
async def main():
loop = asyncio.get_running_loop()
#run_in_executor(默认ThreadPoolExecutor)
#第一步:内部先调用ThreadPoolExecutor的submit方法去线程池中申请一个线程去执行func函数,并返回一个concurrent.futures.Future对象
#第二步:调用asyncio.wrap_future将concurrent.futures.Future对象转为asyncio.Future对象,因为concurrent.futures.Future不支持await方法
fut = loop.run_in_executor(None, func)
ret = await fut
print('default thread pool')
#with concurrent.futures.ThreadPoolExecutor() as pool:
# result = await loop.run_in_executor(pool,func)
# print('default thread pool')
#with concurrent.futures.ProcessPoolExecutor() as pool:
# result = await loop.run_in_executor(pool,func)
# print('custom process pool',result)
asyncio.run(main())
对应爬虫案例(requests模块不支持异步):
import asyncio
import requests
async def download_image(url):
print("开始下载:",url)
loop = asyncio.get_event_loop()
# requests模块默认不支持异步操作,所以使用线程池来配合实现
future = loop.run_in_executor(None, requests.get, url)
response = await future
print("下载完成")
# 图片保存到本地
file_name = url.rsplit('_')[-1]
with open(file_name, mode='wb') as file_object:
file_object.write(response.content)
if __name__ == '__main__':
url_lst = [
]
tasks = [download_image(url) for url in url_lst]
loop = asyncio.get_event_loop()
loop.run_until_complete(asyncio.wait(tasks))
4.7异步迭代器
什么是异步迭代器
实现了__aiter__()
和__anext()__
方法的对象。async_for会处理异步迭代器的__anext__()
方法所返回的可等待对象,直到引发一个StopAsyncIteration
异常。
什么是异步可迭代对象
可在async_for
语句中被使用的对象。必须通过__aiter
__()方法返回一个asynchronous_iterator
import asyncio
class Reader(object):
""" 自定义异步迭代器(同时也是异步可迭代对象) """
def __init__(self):
self.count = 0
async def readline(self):
self.count += 1
if self.count == 100:
return None
return self.count
def __aiter__(self):
return self
async def __anext__(self):
val = await self.readline()
if val == None:
raise StopAsyncIteration
return val
# 在异步方法中写for循环没问题
async def func():
obj = Reader()
async for item in obj:
print(item)
asyncio.run( func() )
4.8异步上下文管理
此种对象通过定义__aenter__()
和__aexit()__
方法。
import asyncio
class AsyncContextManager:
def __init__(self):
self.conn = conn
async def do_something(self):
# 异步操作数据库
return 666
async def __aenter__(self):
# 异步连接数据库
self.conn = await asyncio.sleep(1)
return self
async def __aexit__(self,exc_type,exc,tb):
# 异步关闭数据库
await asyncio.sleep(1)
async def func():
async with AsyncContextManager() as f:
result = await f.do_something()
print(result)
asyncio.run(func())
4.9.uvloop
uvloop是asyncio中默认事件循环的替代方案,它更快
使用:
# pip install uvloop
import asyncio
import uvloop
asyncio.set_event_loop_policy(uvloop.EventLoopPolicy())
#编写asyncio的代码,与之前代码一致
#内部的事件循环自动转为uvloop
asyncio.run(...)
ps:django3.x(asgi->uvicron)和fastapi底层都是使用了uvloop
5.fastapi
import asyncio
import uvicorn
import aioredis
from aioredis import Redis
from fastapi import FastAPI
import time
app = FastAPI()
REDIS_POOL = aioredis.ConnectionPool('redis://127.0.0.1:6379',minsize=1,maxsize=10)
@app.get("/")
def index():
print("请求来了")
time.sleep(5)
return {"message":"hello"}
@app.get("/red")
async def red():
"""异步操作接口"""
print("请求来了")
await asyncio.sleep(10)
# #连接池获取一个连接
# conn = await REDIS_POOL.acquire()
# redis = Redis(conn)
# #设置值
# await redis.hmset_dict('car',key1=1,key2=2)
# #读取值
# result = await redis.hgetall('car',encoding='utf-8')
# print(result)
# # 连接归还连接池
# REDIS_POOL.release(conn)
# return result
return 'xx'
if __name__ == '__main__':
uvicorn.run("fastapitest:app",host='127.0.0.1',port=5000,log_level="info")
压测例子:
fastapi最精彩的地方:
async函数会放到event loop中执行。
那么,普通的函数会会放到thread pool中 ,线程池又跟电脑配置有关(线程池中数量:核数*5)
from fastapi import FastAPI
import time
import asyncio
import os
app = FastAPI()
@app.get("/async_slowest")
async def async_slowest(): #执行最慢,串行执行
time.sleep(1)
return {"message": "async mode but use sync sleep"}
@app.get("/async_sleep_in_thread")
async def async_sleep_in_thread():
loop = asyncio.get_event_loop()
await loop.run_in_executor(None, time.sleep, 1)
return {"message": "sleep run in thread pool"}
@app.get("/async_sleep")
async def async_sleep(): #执行最快,协程之间切换消费较少资源
await asyncio.sleep(1)
return {"message": "async mode sleep"}
@app.get("/sync")
def sync_sleep(): #执行第三快,普通函数会放到thread pool中
time.sleep(1)
return {"message": "sync, but run in thread pool"}
if __name__ == '__main__':
uvicorn.run("fastapitest:app",host='127.0.0.1',port=5000,log_level="info")
6.压测工具
ab、hey