浅谈协程 - Now_playing

公告

在程序遇到性能瓶颈的时候，解决方案之一就是采用并发编程技术。

尤其是使用Python这种“执行低效”的编程语言，如何用其实现高效地并发能力被屡屡提起。由于众所周知的原因，在别的语言中常用的多线程并发编程模型在Python里不那么好了。

有群不明就里的闲蛋（闲的蛋疼的人），认为GIL让多线程无法并行执行，他的生命的天空就是灰蒙蒙的。多进程太耗系统资源，多线程又不让好好玩，于是，用Python的同学在稍有编程经验后，就会尝试去弄明白Python菜鸟老鸟都常挂在嘴边的协程是什么。

协程（Co-routine）

见名知义，协作式的例程。下面深入解析。

协程是非抢占式的多任务子例程的概括，可以允许有多个入口点在例程中确定的位置来控制程序的暂停与恢复执行。多个入口点是指可以在一个协程内多次使用如yield的关键字，每个yield的位置，都是程序员可以使之让出执行权、暂停、恢复、传递信号、注入执行结果等操作。

高德纳说，例程是协程的特例。暂不深入解析这句话，但我们应该知道了，协程、例程本质上是一回事，不过表现有所差异。例程，就是函数、方法，所以协程在代码的体现，也就是按照函数、方法那样去定义的。

函数在线程内执行，协程当然也在线程内执行，多个协程共享着该线程拥有的资源。由于协程就是函数或方法，在线程运行初始化时，所以，与函数一样，协程的数据结构存放在线程的栈内存中。所以协程的切换，实际上还是函数的调用，是在线程的栈内存中完成的。 进程和线程的切换，要保存的状态很复杂很多，内存占用量也要大很多，涉及的操作系统调度也复杂很多。这就是协程的切换开销比线程和进程都小太多的原因。

注意，协程是可以跨线程调度的，就像一个函数可以放到另一个线程去执行一样。

协程和进程或线程的不同之处。协程要有多少个入口点（即yield多少次）、和接下来调用哪个协程（即yield谁）、各自运行什么任务（占用多少资源）都是程序猿在编程中实现的。这既是优点也是缺点，可见，要用协程写出高质量的并发代码，对程序员的质量有很高的要求。

进程和线程都是由操作系统来调度的，什么时候中断、什么时候返回、接下来调度谁，都是操作系统包办。而且都是抢占式调度，优先级平等的多进程和多线程的执行顺序是不可预测的，而协程的执行顺序是可以被安排的。

协程和一般例程（函数/方法）的区别。函数执行是从其第一行开始，一直到返回为止（没有显式return语句的也有返回）。从开始到返回，执行完了，就退出了，生命周期随之结束。函数在各次调用之间，并不会保存之前的执行状态。而协程，有多个入口点，可能会被调度多次，一个协程的暂时退出，是靠调用别的协程实现的。协程的调用，还会保存之前的执行状态，切换到另一个协程后，可以再回来继续往下执行。协程执行的起点，是进入该协程的入口点，不一定是协程定义的第一行代码，该次调用的终点，也不一定是协程的最后一行代码。

协程是用户态线程吗？

你特么在逗我。这种说法，是在无端增加人们理解协程的负担。协程，不是用户态线程，也不是用户（程序员）控制着的线程（如果换成“类似线程的东西”，勉强过得去）。

那再啰嗦一下什么是用户态，以及用户态线程。

操作系统在执行代码的时候，会对代码区别对待，使代码具有不同的权限，意味着不同的代码段可以操控不同的内存区域和各种计算机资源的访问。就是为了实现耳熟能详的“保护模式”。保护模式是为了避免程序员提供给系统执行的代码影响到系统的稳定性和安全性。

所以，操作系统内核的代码几乎都是有特权的，所谓的内核态，Ring0级特权；而程序员编写的应用程序，大多是面向一般用户，几乎都是没有特权的，所谓用户态，Ring3普通权限。所以，一段代码是什么等级，就说这段代码就正处于该等级对应的状态。

然而，程序员也可能需要操作系统底层资源，比如要在系统内植入病毒、木马。当某病毒线程通过中断门、调用门等方式进入内核态破坏操作系统的时候，它当时是内核态线程；如果这个病毒它一会儿又要为你下载日本电影做单纯地文件访问，那它当时就是用户态线程。

明白了吗？别再说协程是用户态线程，这样显得读的书少。

posted on 2018-03-02 09:12 Now_playing 阅读(264) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

相关概念

进程（Process）

子进程、父进程、主进程

线程(Thread)

子线程、父线程、主线程

例程（Routine）

子例程（Subroutine）

并发(Concurrent)

并行(Parallel)

协程（Co-routine）

协程是用户态线程吗？