并行开发 —— 第七篇 简要分析任务与线程池
其实说到上一篇,我们要说的task的知识也说的差不多了,这一篇我们开始站在理论上了解下“线程池”和“任务”之间的关系,不管是
说线程还是任务,我们都不可避免的要讨论下线程池,然而在.net 4.0以后,线程池引擎考虑了未来的扩展性,已经充分利用多核微处理器
架构,只要在可能的情况下,我们应该尽量使用task,而不是线程池。
首先看一下task的结构
从图中我们可以看出Task.Factory.StartNew()貌似等同于用ThreadPool.QueueUserWorkItem()创建,但是请注意,我是用TPL的形式
使用线程池,要知道task出现以后,一直标榜着以更少的工作量,更低的性能消耗来PK原始线程。
这里简要的分析下CLR线程池,其实线程池中有一个叫做“全局队列”的概念,每一次我们使用QueueUserWorkItem的使用都会产生一个
“工作项”,然后“工作项”进入“全局队列”进行排队,最后线程池中的的工作线程以FIFO的形式取出,效果图类似如下:
这里要值得一提的是,在.net 4.0之后“全局队列”采用了无锁算法,相比以前版本锁定“全局队列”带来的性能瓶颈有了很大的改观。那么任务
委托的线程池不光有“全局队列”,而且每一个工作线程都有”局部队列“,效果图如下
我们的第一反应肯定就是“局部队列“有什么好处,可以考虑这样的情况,当我们new一个task的时候“工作项”就会进去”全局队列”,如果我们的
task执行的非常快,那么“全局队列“就会FIFO的非常频繁,那么有什么办法缓解呢?当我们的task在嵌套的场景下,“局部队列”就要产生效果了,
比如我们一个task里面有3个task,那么这3个task就会存在于“局部队列”中。
1 class Program 2 { 3 static void Main(string[] args) 4 { 5 var task = Task.Factory.StartNew(() => 6 { 7 var task1 = Task.Factory.StartNew(Run1); 8 var task2 = Task.Factory.StartNew(Run2); 9 var task3 = Task.Factory.StartNew(Run3); 10 11 Task.WaitAll(new Task[] { task1, task2, task3 }); 12 }); 13 14 Console.Read(); 15 } 16 17 public static void Run1() { Thread.Sleep(100000); } 18 19 public static void Run2() { Thread.Sleep(100000); } 20 21 public static void Run3() { Thread.Sleep(100000); } 22 }
从图中可以看到,其实“局部队列“起到了一个分流的作用,也叫做”任务内联化“,”局部队列“采用的是”LIFO"的形式,其实这样的形式也是
为了提升性能之用,因为Run3送到“局部队列”中时可能还存在CPU的高速缓存中,所以从“局部队列”中取出来相对来说更快一点,最后的效
果就是Run3要理论上优先于Run2,Run1先执行。
现在我们再来考虑这样一种情况,比如有两个人,一个人干完了分配给自己的所有活,而另一个人却还有很多的活,从人情上说,闲的人应
该接手点忙的人的活,同样,对应图中“线程2“跑完了“局部队列”中的所有任务,并且同时发现”全局队列“中已经没有可以跑的”任务“了,然而
“线程1”里面还有Run1,Run2,Run3,那么此时“线程2”采用“FIFO”的形式窃取“线程1”里面的任务。
从上面种种情况我们看到,这些分流和负载都是普通ThreadPool.QueueUserWorkItem所不能办到的,所以说在.net 4.0之后,我们
尽可能的使用TPL,抛弃ThreadPool。