Python3协程(coroutine)理解
一、背影说明
最早开始接解协程应该是看到Scrapy库代码里有await的字眼,接下来曾多次尝试理解协程怎么用,但都失败了。
主要的问题是很多文章上来就是告诉你生成器是什么、原理是什么,我一直觉得原理这东西深入理解时是应该的,但是我作为一个小白我不希望你跟我讲原理,我没耐心也听不懂。
我只希望你告诉我协程有什么用效果是什么、我该怎么调用。
今天又去看了一下,有些理解,但不一定准确,为了下次不重头再来,暂且先记一记。
二、协程和线程的比较及其适用场景
2.1 共用变量问题
多线程中可能出现多个线程争抢变量,所以变量需要加锁;协程中任一时刻都只有一个线程,所以变量不需要加锁。
但是协程虽然不像多线程争抢变量但仍是和多线程一样共用变量的,即共用变量在某处改变在另外一处引用时也会发生改变。
2.2 协程的适用场景
从资源角度说,协程只有一个线程只能使用一个cpu核,所以它适合用于IO密集(包括磁盘IO和网络IO)函数,并不适用于计算密集函数。
从事情重复性说,协程类似多线程,适用于被反复调用的函数(for或while),也可用于做不同事情的多个函数。
2.3 协程的切换
线程是由操作系统来控制切换的,并不需要我们自己来调度;但协程在操作系统中表现为一个线程,其调度操作系统无能为力,只得我们自己来实现。
await关键字表示该位置阻塞时可让出cpu执行,即切换到下一协程运行;但追根究底对我们而言好像只有await asyncio.sleep()(另外还有future但这个暂不考虑吧)。
所以各协程间一定要在某个地方(尤其是循环内)使用await asyncio.sleep()谦让给其他协程,不然如果协程一直不谦让那其他协程,那其他协程只能等该协程运行完才能运行了。
三、协程代码实现
3.1 协程函数的定义
正常函数怎么写就怎么写,在def前面加上async即可。如:
async def say_after(delay, what): await asyncio.sleep(delay) print(what)
3.2 协程函数的调用
入口函数使用asyncio.run() 进行调用。如:
import asyncio async def main(): print(f"started at {time.strftime('%X')}") print('hello world!') print(f"finished at {time.strftime('%X')}") if __name__ == "__main__": # 入口函数通过asyncio.run()调用 asyncio.run(main())
一般协程函数调用时在其前面加上await关键字进行调用:
import asyncio import time async def say_after(delay, what): await asyncio.sleep(delay) print(what) async def main(): print(f"started at {time.strftime('%X')}") # 在前面加上await进行调用 # 这种形式和正常的同步执行程序效果上没什么区别,仍是执行完上一步再执行下一步 await say_after(1, 'hello') await say_after(2, 'world') print(f"finished at {time.strftime('%X')}") if __name__ == "__main__": # 入口函数通过asyncio.run()调用 asyncio.run(main())
最后一种是通过asyncio.create_task()调用一般协程函数。
第二种调用方式也是调用一般协程函数,但是如果只是这么调用的话协程函数并没有什么作用,比如上边这个函数耗时仍然和正常的同步版本一样是3秒。
协程的意义在正在于asyncio.create_task()调用形式,asyncio.create_task()可以将协程函数包装成任务,多个任务之间可并行执行。如下写法只耗时2秒。
import asyncio import time class TestAsync: async def say_after(self,delay, what): await asyncio.sleep(delay) print(what) async def main(self): print(f"started at {time.strftime('%X')}") task_list = [] # 等价于[1,2] for i in range(1, 3, 1): # 步骤一、使用asyncio.create_task()调用协程函数,封装成任务 tmp_task = asyncio.create_task(self.say_after(i, 'hello')) task_list.append(tmp_task) # 第二步,await任务 for tmp_task in task_list: await tmp_task print(f"finished at {time.strftime('%X')}") if __name__ == "__main__": obj = TestAsync() asyncio.run(obj.main())
参考:
https://docs.python.org/zh-cn/3/library/asyncio-task.html