两年前,微软亚洲研究院出版了《编程之美》一书,其中的第一章第一节“让CPU占用率曲线听你指挥”一文,可谓是在全国范围内掀起了一股玩转CPU占用率曲线热。我本人甚至在坐公交的时候都在思考如何折腾CPU占用率曲线。
书中给出了这样一张让人耳目一新的图,吸引了万千IT少年:
也许您会觉得这还不够好玩。我也是。对了,今天流牛木马打算与各位看官讨论的,是以下这幅图的效果——双核的CPU,左手画圆,右手画方!
该书出版的时候,我正在微软亚洲研究院创新工程组实习,该书的好几位作者都是我的好朋友,如李东、陈远等 ——于是我可以负责任地告诉大家,该书的所有实习生作者 ,当时他们使用的都是Intel P4 3.4Ghz单核CPU ! o(∩_∩)o
今天突然想到了这里,就打算拿我的Thinkpad T60来试试。CPU是Genuine Intel(R) CPU T2400 @1.83Ghz , 双核。
首先我将书中提供的C++代码翻译成了C# .翻译过程没任何技术难度,仅供各位看官了解个大概:
using System; using System.Collections.Generic; using System.Linq; using System.Text; namespace ConsoleApplication1 { class Program { static void Main(string[] args) { const double SPLIT = 0.01; const int COUNT = 200; const double PI = 3.14159265; const int INTERVAL = 100; double[] busySpan = new double[COUNT]; //array of busy times double[] idleSpan = new double[COUNT]; //array of idle times int half = INTERVAL / 2; double radian = 0.0; for (int i = 0; i < COUNT; i++) { busySpan[i] = (double)(half + (Math.Sin(PI * radian) * half)); idleSpan[i] = INTERVAL - busySpan[i]; radian += SPLIT; } double startTime = 0; int j = 0; while (true) { j = j % COUNT; startTime = Environment.TickCount; while ((Environment.TickCount - startTime) <= busySpan[j]) ; System.Threading.Thread.Sleep((int)idleSpan[j]); j++; } } } }
将这段代码直接F5, 运行结果如下:
果然,与大家意料的一样,两个CPU中都会显示出非常扭曲、不规则的正弦曲线。
按照书中的说法,C++程序可以使用WinAPI里的SetThreadAffinityMast()函数,将程序固定到某个特定的CPU上执行。
查了下MSDN,当然,在.NET里,也有Manage的相似代码。见http://msdn.microsoft.com/zh-tw/library/system.diagnostics.process.processoraffinity(VS.80).aspx
按照MSDN,在代码中加入了简单的两句:
System.Diagnostics.Process p = System.Diagnostics.Process.GetCurrentProcess(); p.ProcessorAffinity = (IntPtr)0x0001;
然后再次F5, CPU中的曲线如下图所示:
1号CPU成规则的正弦曲线相当完美,2号CPU使用率一直为0.
看来这就是书中想让大家达到的效果了。
这个效果让人感觉非常枯燥乏味。2号CPU的资源就浪费掉了,有没有办法将它利用起来呢?
让我们来分析这两句代码:
while ((Environment.TickCount - startTime) <= busySpan[j]) ;
System.Threading.Thread.Sleep((int)idleSpan[j]);
它的意思是,在规定好的时间间隔内(程序中规定了是100毫秒),满负载运行(通过空循环)构成正弦函数需要运行的时间(由之前的计算得到),其余时间就睡觉。如运行69毫秒,睡觉31毫秒,那么在这100毫秒的时间段,CPU的平均占用率就是69%。由于CPU占用率曲线是1秒钟更新一次的,程序使用的每100毫秒一个平均值节点,曲线的平滑度足够了。
继续发散。刚才的例子,如果是运行69毫秒,睡觉50毫秒呢? 那么当前的100毫秒CPU占用率仍然会是69%,但如果算法不加调整,仍然以100毫秒为一个平均值节点,这就影响到了下一个100毫秒的CPU占用率。前一个影响后一个,如多米诺骨牌一样,整体的曲线就完全错误了。
也就是说,我们用来控制CPU平均占用率的时间段,每段必须相等。
我们考虑到以上的代码中,在1号CPU中运行了69毫秒,剩下了31毫秒如果转到2号CPU中运行,1号CPU的占用就会降到0,但与此同时我们就可以在2号CPU中“画方”了。
概括起来说就是,当1号CPU小寐的时候,程序在2号CPU中“画方”;1号CPU小寐结束的时候,2号CPU中当前周期的“方”必须完成。
需要注意的是,假如1好CPU画了69毫秒,那么2号CPU一定只能画31毫秒。
按照这个思路,我们先实验一下简单的:在1号CPU中画正弦曲线后的休息时间段,我们在2号CPU中画余弦曲线。呵呵,初中学的三角函数你忘了吗?
我们将原代码中的空循环改为:
while (true) { j = j % COUNT; p.ProcessorAffinity = (IntPtr)0x0001; startTime = Environment.TickCount; while ((Environment.TickCount - startTime) <= busySpan[j]) ; p.ProcessorAffinity = (IntPtr)0x0002; while ((Environment.TickCount - startTime) <= idleSpan[j]) ; j++; }
“左手正弦,右手余弦”结果差强人意:
我们注意到这个曲线没有之前单CPU运行时那么精确的。
原因是我们切换CPU的运营占用了时间。例如,以前正弦画了69毫秒,我们计算出余弦应该画31毫秒,但切换CPU的操作可能占用了3毫秒(或更多、或每次耗时都不同),整体就不在100毫秒这个间隔范围了,所以曲线结果有误差。
到这里,我的思路已经说完了,相信大家已经明白。
不过, 走到这一步,追求完美的我们,的确是遇到了一点障碍。
我经过一些周期上的微调,并且将余弦函数改为了简单的方波函数,最终效果正如本文开头展示的一样,还是不错的。
调整办法?呵呵,真不好意思,我暂时还没有想到一个足够说服大家、可以公式化的调整办法,就请各位看官在这里八仙过海,各显神通咯~