Python协程

Gevent是一个基于Greenlet实现的网络库,通过greenlet实现协程。基本思想是一个greenlet就认为是一个协程, 当一个greenlet遇到IO操作的时候,比如访问网络,就会自动切换到其他的greenlet,等到IO操作完成,再在适当的时候切换回来继续执行。由于IO操作非常耗时,经常使程序处于等待状态,有了gevent为我们自动切换协程,就保证总有greenlet在运行,而不是等待IO操作。

 

1. Greenlet是作为一个C扩展模块,它封装了libevent事件循环的API,可以让开发者在不改变编程习惯的同时,用同步的方式写异步IO的代码。

from urllib import request
import gevent

def test(url):
    print('[%s]Get: %s'% (gevent.getcurrent(), url))
    response = request.urlopen(url)
    content = response.read().decode('utf8')
    print('[%s]%d bytes received from %s.' % (gevent.getcurrent(), len(content), url))

if __name__ == '__main__':
    gevent.joinall([
        gevent.spawn(test, 'http://www.baidu.com'),
        gevent.spawn(test, 'http://httpbin.org/ip'),
        gevent.spawn(test, 'http://httpbin.org/uuid')
    ])

执行结果:

 

2. 可以看到3个greenlet是依次运行,而不是交替运行。要让greenlet交替运行,可以通过gevent.sleep()交出控制权.

from urllib import request
import gevent

def test(url):
    print('[%s]Get: %s'% (gevent.getcurrent(), url))
    response = request.urlopen(url)
    content = response.read().decode('utf8')
    gevent.sleep(1)
    print('[%s]%d bytes received from %s.' % (gevent.getcurrent(), len(content), url))

if __name__ == '__main__':
    gevent.joinall([
        gevent.spawn(test, 'http://www.baidu.com'),
        gevent.spawn(test, 'http://httpbin.org/ip'),
        gevent.spawn(test, 'http://httpbin.org/uuid')
    ])

执行结果:

 

3. 在实际的代码里,我们不会用gevent.sleep()去切换协程,而是在执行到IO操作时gevent会自动完成。所以gevent需要将Python自带的一些标准库的运行方式由阻塞式调用变为协作式运行。这一过程在启动时通过monkey patch完成.

from gevent import monkey; monkey.patch_all() # 协作式运作
from urllib import request
import gevent

def test(url):
    print('[%s]Get: %s'% (gevent.getcurrent(), url))
    response = request.urlopen(url)
    content = response.read().decode('utf8')
    print('[%s]%d bytes received from %s.' % (gevent.getcurrent(), len(content), url))

if __name__ == '__main__':
    gevent.joinall([
        gevent.spawn(test, 'http://www.baidu.com'),
        gevent.spawn(test, 'http://httpbin.org/ip'),
        gevent.spawn(test, 'http://httpbin.org/uuid')
    ])

执行结果:

 

 三个网络IO操作时并发执行的,而且结束顺序不同,但是只有一个线程。

协程和多线程的差异在于多线程的切换需要靠操作系统来完成,当线程越来越多的时候切换的成本会很高,而协程是在一个线程内切换的,切换过程由我们自己控制,因此开销小的多,这就是协程和多线程的根本差异。

posted @ 2021-01-25 23:36  风不再来  阅读(66)  评论(0编辑  收藏  举报