Golang抢占式调度
Golang抢占式调度
在1.12版本之前,go的调度器不支持抢占式调度,程序只能依靠Goroutine主动让出CPU资源才能触发调度,会引发一些问题,如
- 某些Goroutine可以长时间占用线程,造成其它 Goroutine的饥饿
- 垃圾回收器是需要stop the world的。如果垃圾回收器想要运行了,那么它必须先通知其它的goroutine合作停下来,这会造成较长时间的等待时间。
基于协作的抢占式调度
Goroutine引入了stackguard0字段,当该字段设置为StackPreempt意味着当前Goroutine发出了抢占请求;同时在runtime.newstack:1e112cd中增加抢占的代码,当stackguard0等于StackPreempt时触发调度器抢占让出线程。
gorogoutine创建之初,栈的大小是固定的,为了防止栈溢出,编译器会在有明显栈消耗的函数头部插入一些检测代码,通过stackguard0值来决定是否触发runtime.morestack函数。将stackguard0设置为StackPreempt作用是进入函数时必定触发runtime.morestack,然后在调用runtime.newstack。
工作机制
- 编译器会在调用函数前插入runtime.morestack,可能会调用runtime.newstack进行抢占
- Go语言运行时会在垃圾回收暂停程序、系统监控发现Goroutine运行超过10ms时发出抢占请求StackPreempt
- 当发生函数调用时,可能会执行编译器插入的runtime.morestack,它调用的runtime.newstack会检查Goroutine的stackguard0字段是否为 StackPreempt;
- 如果stackguard0是StackPreempt,就会触发抢占让出当前线程;
但是这种调度并不完备,比如一个goroutine运行了很久,但是它并没有调用另一个函数,则它不会被抢占。
基于信号的抢占式调度
在之前的依赖栈增长检测代码的方式,遇到没有函数调用的情况下就会出现问题,在Go1.14这一问题得到解决。
在Linux中这种真正的抢占式调度是基于信号完成的,所以也称为“异步抢占”。
工作机制
- M注册一个SIGURG信号的处理函数:sighandler。
- sysmon线程检测到执行时间过长的goroutine或者GC stw时,会向相应的M(或者说线程,每个线程对应一个 M)发送SIGURG信号。
- 收到信号后,内核执行sighandler函数,通过pushCall插入asyncPreempt函数调用。
- 回到当前goroutine执行asyncPreempt函数,通过mcall切到g0栈执行gopreempt_m。
- 将当前goroutine插入到全局可运行队列,M则继续寻找其他goroutine来运行。
- 被抢占的goroutine再次调度过来执行时,会继续原来的执行流。
基于信号的抢占式调度,抢占也只会在垃圾回收扫描任务时触发。
danran