python 协程
什么是协程、异步
举个例子:假设有1个洗衣房,里面有10台洗衣机,有一个洗衣工在负责这10台洗衣机。那么洗衣房就相当于1个进程,洗衣工就相当1个线程。如果有10个洗衣工,就相当于10个线程,1个进程是可以开多线程的。这就是多线程!
那么协程呢?先不急。大家都知道,洗衣机洗衣服是需要等待时间的,如果10个洗衣工,1人负责1台洗衣机,这样效率肯定会提高,但是不觉得浪费资源吗?明明1 个人能做的事,却要10个人来做。只是把衣服放进去,打开开关,就没事做了,等衣服洗好再拿出来就可以了。就算很多人来洗衣服,1个人也足以应付了,开好第一台洗衣机,在等待的时候去开第二台洗衣机,再开第三台,……直到有衣服洗好了,就回来把衣服取出来,接着再取另一台的(哪台洗好先就取哪台,所以协程是无序的)。这就是计算机的协程!
洗衣机就是执行的方法。
当你程序中方法需要等待时间的话,就可以用协程,效率高,消耗资源少。
好了!现在来总结一下:
洗衣房 ==> 进程
洗衣工 ==> 线程
洗衣机 ==> 方法(函数)
线程与协程的关系
- 协程是属于线程的,一个线程可以有多个协程。协程程序是在线程里面跑的
- 协程没有线程的上下文切换消耗。协程的调度切换是用户(程序员)手动切换的,因此更加灵活。
async/await 的使用
正常的函数在执行时是不会中断的,所以你要写一个能够中断的函数,就需要添加async关键。
async 用来声明一个函数为异步函数,异步函数的特点是能在函数执行过程中挂起,去执行其他异步函数。
await 用来声明程序挂起
,比如异步程序执行到某一步时需要等待的时间很长,就将此挂起,去执行其他的异步程序。a
wait相当于给事件循环增加一个检查点。asyncio.wait就不停的检查各种await函数是否执行完毕
await 后面只能跟异步程序或有__await__属性的对象
,因为异步程序与一般程序不同。
如果await后面跟的b函数不是异步函数,那么操作就只能等b执行完再返回,无法在b执行的过程中返回。如果要在b执行完才返回,也就不需要用await关键字了,直接调用b函数就行。所以这就需要await后面跟的是异步函数了。
在一个异步函数中,可以不止一次挂起,也就是可以用多个await。
from time import sleep,time import datetime import asyncio # demo4引入 asyncio 库 def demo1(): start_time = datetime.datetime.now() # 假设有三台洗衣机, 现在有三批衣服需要分别放到这三台洗衣机里面洗 def washing1(): sleep(3) # 第一台3秒洗完 print('washing1 finished') def washing2(): sleep(2) print('washing2 finshed') def washing3(): sleep(5) print('washing3 finshed') washing1() washing2() washing3() # 10 大部分时间都花在挨个等洗衣机上了 print('洗衣服一共用了' + str((datetime.datetime.now() - start_time).seconds) + '秒') demo1() def demo2(): """ 现在我们想要避免无谓的等待, 为了提高效率, 我们将使用 async. washing1/2/3() 本是 "普通函数", 现在我们用 async 把它们升级为 "异步函数". 注: 一个异步的函数, 有个更标准的称呼, 我们叫它 "协程" (coroutine). """ async def washing1(): sleep(3) print('washer1 finished') async def washing2(): sleep(2) print('washer2 finished') async def washing3(): sleep(5) print('washer3 finished') washing1() washing2() washing3() """ 从正常人的理解来看, 我们现在有了异步函数, 但是却忘了定义应该什么时候 "离开" 一台洗衣 机, 去看看另一个... 这就会导致, 现在的情况是我们一边看着第一台洗衣机, 一边着急地想着 "是不是该去开第二台洗衣机了呢?" 但又不敢去 (只是打个比方), 最终还是花了10秒的时间才 把衣服洗完. """ def demo3(): """ 现在我们吸取了上次的教训, 告诉自己洗衣服的过程是 "可等待的" (awaitable), 在它开始洗衣服 的时候, 我们可以去弄别的机器. """ async def washing1(): await sleep(3) # 注意这里加入了 await print('washer1 finished') async def washing2(): await sleep(2) print('washer2 finished') async def washing3(): await sleep(5) print('washer3 finished') washing1() washing2() washing3() """ 尝试运行一下, 我们会发现会报错。这里我说一下原因, 以及在 demo4 中会给出一个最终答案: 1. 第一个问题是, await 后面必须跟一个 awaitable 类型或者具有 __await__ 属性的 对象. 这个 awaitable, 并不是我们认为 sleep() 是 awaitable 就可以 await 了, 常见的 awaitable 对象应该是: await asyncio.sleep(3) # asyncio 库的 sleep() 机制与 time.sleep() 不 同, 前者是 "假性睡眠", 后者是会导致线程阻塞的 "真性睡眠" await an_async_function() # 一个异步的函数, 也是可等待的对象 以下是不可等待的: await time.sleep(3) x = await 'hello' # <class 'str'> doesn't define '__await__' x = await 3 + 2 # <class 'int'> dosen't define '__await__' x = await None # ... x = await a_sync_function() # 普通的函数, 是不可等待的 2. 第二个问题是, 如果我们要执行异步函数, 不能用这样的调用方法: washing1() washing2() washing3() 而应该用 asyncio 库中的事件循环机制来启动 (具体见 demo4 讲解). """ def demo4(): """ 这是最终我们想要的实现. """ async def washing1(): await asyncio.sleep(3) # 使用 asyncio.sleep(), 它返回的是一个可等待的对象 print('washer1 finished') async def washing2(): await asyncio.sleep(2) print('washer2 finished') async def washing3(): await asyncio.sleep(5) print('washer3 finished') """ 事件循环机制分为以下几步骤: 1. 创建一个事件循环 2. 将异步函数加入事件队列 3. 执行事件队列, 直到最晚的一个事件被处理完毕后结束 4. 最后建议用 close() 方法关闭事件循环, 以彻底清理 loop 对象防止误用 """ # 1. 创建一个事件循环 loop = asyncio.get_event_loop() # 2. 将异步函数加入事件队列 tasks = [ washing1(), washing2(), washing3(), ] # 3. 执行事件队列, 直到最晚的一个事件被处理完毕后结束 loop.run_until_complete(asyncio.wait(tasks)) """ PS: 如果不满意想要 "多洗几遍", 可以多写几句: loop.run_until_complete(asyncio.wait(tasks)) loop.run_until_complete(asyncio.wait(tasks)) loop.run_until_complete(asyncio.wait(tasks)) ... """ # 4. 如果不再使用 loop, 建议养成良好关闭的习惯 # (有点类似于文件读写结束时的 close() 操作) loop.close() """ 最终的打印效果: washer2 finished washer1 finished washer3 finished elapsed time = 5.126561641693115 说句题外话, 我看有的博主的加入事件队列是这样写的: tasks = [ loop.create_task(washing1()), loop.create_task(washing2()), loop.create_task(washing3()), ] 运行的效果是一样的, 暂不清楚为什么他们这样做. """ if __name__ == '__main__': # 为验证是否真的缩短了时间, 我们计个时 start = time() # demo1() # 需花费10秒 # demo2() # 会报错: RuntimeWarning: coroutine ... was never awaited # demo3() # 会报错: RuntimeWarning: coroutine ... was never awaited demo4() # 需花费5秒多一点点 end = time() print('elapsed time = ' + str(end - start))