协程

单线程下实现并发

协程介绍

引子

进程是资源分配的最小单位,线程是CPU调度的最小单位。
并发的本质：切换+保存状态
cpu正在运行一个任务，会在两种情况下切走去执行其他的任务（切换由操作系统强制控制），一种情况是该任务发生了阻塞，另外一种情况是该任务计算的时间过长
对于单线程下，我们不可避免程序中出现io操作，但如果我们能在自己的程序中（即用户程序级别，而非操作系统级别）控制单线程下的多个任务能在一个任务遇到io阻塞时就切换到另外一个任务去计算，这样就保证了该线程能够最大限度地处于就绪态，即随时都可以被cpu执行的状态，相当于我们在用户程序级别将自己的io操作最大限度地隐藏起来，从而可以迷惑操作系统，让其看到：该线程好像是一直在计算，io比较少，从而更多的将cpu的执行权限分配给我们的线程。
协程的本质就是在单线程下，由用户自己控制一个任务遇到io阻塞了就切换另外一个任务去执行，以此来提升效率。为了实现它，我们需要找寻一种可以同时满足以下条件的解决方案：

可以控制多个任务之间的切换，切换之前将任务的状态保存下来，以便重新运行时，可以基于暂停的位置继续执行。
作为1的补充：可以检测io操作，在遇到io操作的情况下才发生切换

协程

协程：是单线程下的并发，又称微线程，纤程。英文名Coroutine。一句话说明什么是线程：协程是一种用户态的轻量级线程，即协程是由用户程序自己控制调度的。

强调

python的线程属于内核级别的，即由操作系统控制调度（如单线程遇到io或执行时间过长就会被迫交出cpu执行权限，切换其他线程运行）
单线程内开启协程，一旦遇到io，就会从应用程序级别（而非操作系统）控制切换，以此来提升效率（！！！非io操作的切换与效率无关）

对比操作系统控制线程的切换，用户在单线程内控制协程的切换
优点

协程的切换开销更小，属于程序级别的切换，操作系统完全感知不到，因而更加轻量级
单线程内就可以实现并发的效果，最大限度地利用cpu

缺点

协程的本质是单线程下，无法利用多核，可以是一个程序开启多个进程，每个进程内开启多个线程，每个线程内开启协程
协程指的是单个线程，因而一旦协程出现阻塞，将会阻塞整个线程

协程的特点

必须在只有一个单线程里实现并发
修改共享数据不需加锁
用户程序里自己保存多个控制流的上下文栈
附加：一个协程遇到IO操作自动切换到其它协程（如何实现检测IO，yield、greenlet都无法实现，就用到了gevent模块（select机制））

Greenlet模块

greenlet只是提供了一种比generator更加便捷的切换方式，当切到一个任务执行时如果遇到io，那就原地阻塞，仍然是没有解决遇到IO自动切换来提升效率的问题。

greenlet实现状态切换

from greenlet import greenlet
import time


# greenlet 也没有实现遇到IO就切换

def eat(name):
    print('{} eat 1'.format(name))
    time.sleep(1)
    g2.switch('大黄')
    print('{} eat 3'.format(name))
    g2.switch()


def play(name):
    print('{} play 2'.format(name))
    time.sleep(2)
    g1.switch()
    print('{} play 4'.format(name))


g1 = greenlet(eat)
g2 = greenlet(play)

g1.switch('大黄')

Gevent模块

Gevent 是一个第三方库，可以轻松通过gevent实现并发同步或异步编程，在gevent中用到的主要模式是Greenlet, 它是以C扩展模块形式接入Python的轻量级协程。 Greenlet全部运行在主程序操作系统进程的内部，但它们被协作式地调度。

遇到IO就切换

import gevent
from gevent import monkey

monkey.patch_all()  # 打补丁，帮助gevent识别time.sleep 阻塞
import time


def eat(name):
    print('{} eat 1'.format(name))
    time.sleep(2)
    print('{} eat 3'.format(name))


def play(name):
    print('{} play 2'.format(name))
    time.sleep(2)
    print('{} play 4'.format(name))


g1 = gevent.spawn(eat, '233')
g2 = gevent.spawn(eat, name='233')

# g1.join()
# g2.join()

gevent.joinall([g1, g2])
print('主线程')

posted @ 2018-12-05 21:26 写bug的日子阅读(159) 评论(0) 收藏举报

刷新页面返回顶部

写bug的日子

协程

协程

协程介绍

引子

协程

Greenlet模块

Gevent模块

公告