Python3协程(coroutine)理解

一、背影说明

最早开始接解协程应该是看到Scrapy库代码里有await的字眼,接下来曾多次尝试理解协程怎么用,但都失败了。

主要的问题是很多文章上来就是告诉你生成器是什么、原理是什么,我一直觉得原理这东西深入理解时是应该的,但是我作为一个小白我不希望你跟我讲原理,我没耐心也听不懂。

我只希望你告诉我协程有什么用效果是什么、我该怎么调用。

今天又去看了一下,有些理解,但不一定准确,为了下次不重头再来,暂且先记一记。

 

二、协程和线程的比较及其适用场景

2.1 共用变量问题

多线程中可能出现多个线程争抢变量,所以变量需要加锁;协程中任一时刻都只有一个线程,所以变量不需要加锁。

但是协程虽然不像多线程争抢变量但仍是和多线程一样共用变量的,即共用变量在某处改变在另外一处引用时也会发生改变。

 

2.2 协程的适用场景

从资源角度说,协程只有一个线程只能使用一个cpu核,所以它适合用于IO密集(包括磁盘IO和网络IO)函数,并不适用于计算密集函数。

从事情重复性说,协程类似多线程,适用于被反复调用的函数(for或while),也可用于做不同事情的多个函数。

 

2.3 协程的切换

线程是由操作系统来控制切换的,并不需要我们自己来调度;但协程在操作系统中表现为一个线程,其调度操作系统无能为力,只得我们自己来实现。

await关键字表示该位置阻塞时可让出cpu执行,即切换到下一协程运行;但追根究底对我们而言好像只有await asyncio.sleep()(另外还有future但这个暂不考虑吧)。

所以各协程间一定要在某个地方(尤其是循环内)使用await asyncio.sleep()谦让给其他协程,不然如果协程一直不谦让那其他协程,那其他协程只能等该协程运行完才能运行了。

 

三、协程代码实现

3.1 协程函数的定义

正常函数怎么写就怎么写,在def前面加上async即可。如:

async def say_after(delay, what):
    await asyncio.sleep(delay)
    print(what)

 

3.2 协程函数的调用

入口函数使用asyncio.run() 进行调用。如:

import asyncio


async def main():
    print(f"started at {time.strftime('%X')}")

    print('hello world!')

    print(f"finished at {time.strftime('%X')}")

if __name__ == "__main__":
    # 入口函数通过asyncio.run()调用
    asyncio.run(main())

一般协程函数调用时在其前面加上await关键字进行调用:

import asyncio
import time

async def say_after(delay, what):
    await asyncio.sleep(delay)
    print(what)

async def main():
    print(f"started at {time.strftime('%X')}")

    # 在前面加上await进行调用
    # 这种形式和正常的同步执行程序效果上没什么区别,仍是执行完上一步再执行下一步
    await say_after(1, 'hello')
    await say_after(2, 'world')

    print(f"finished at {time.strftime('%X')}")


if __name__ == "__main__":
    # 入口函数通过asyncio.run()调用
    asyncio.run(main())

最后一种是通过asyncio.create_task()调用一般协程函数。

第二种调用方式也是调用一般协程函数,但是如果只是这么调用的话协程函数并没有什么作用,比如上边这个函数耗时仍然和正常的同步版本一样是3秒。

协程的意义在正在于asyncio.create_task()调用形式,asyncio.create_task()可以将协程函数包装成任务,多个任务之间可并行执行。如下写法只耗时2秒。

import asyncio
import time

class TestAsync:
    async def say_after(self,delay, what):
        await asyncio.sleep(delay)
        print(what)

    async def main(self):
        print(f"started at {time.strftime('%X')}")

        task_list = []
        # 等价于[1,2]
        for i in range(1, 3, 1):
            # 步骤一、使用asyncio.create_task()调用协程函数,封装成任务
            tmp_task = asyncio.create_task(self.say_after(i, 'hello'))
            task_list.append(tmp_task)

        # 第二步,await任务
        for tmp_task in task_list:
            await tmp_task

        print(f"finished at {time.strftime('%X')}")

if __name__ == "__main__":
    obj = TestAsync()
    asyncio.run(obj.main())

 

参考:

https://docs.python.org/zh-cn/3/library/asyncio-task.html

 

posted on 2021-03-10 18:39  诸子流  阅读(647)  评论(0编辑  收藏  举报