第5章 不要让线程成为脱缰的野马(Keeping your Threads on Leash) ---干净的终止一个线程
干净的终止一个线程
我曾经在第2章产生一个后台线程,用以输出一张屏幕外的 bitmap 图。我们必须解决的一个最复杂的问题就是,如果用户企图结束程序,而这张bitmap 图尚未完成,怎么办?第2章的一个鸵鸟做法就是在任何 worker 线程还没完成其工作之前,不准用户结束程序。只要修改主消息循环,使消息循环不得在任何一个 worker 线程尚未结束之前结束,即可办到。这种做法的最大优点就是“简单”,但万一 bitmap 图十分复杂,需要很长的工作时间,那么程序有可能看起来像是“挂”了一样。
利用TerminateThread() 放弃一个线程
这正是 Win32 程序设计的一般性问题。我如何能够安全地关闭任何执行中的线程呢?最明显的答案就是利用 TerminateThread():
BOOL TerminateThread(
HANDLE hThread,
DWORD dwExitCode
);
参数
hThread 欲令其结束之线程的 handle。该线程就是我们的行动目标。
dwExitCode 该线程的结束代码。
返回值
如果函数成功,则传回 TRUE。如果失败,则传回 FALSE。GetLastError()可以获知更多细节。
TerminateThread() 看起来不错, 直到我读了一份文件, 上面说:“TerminateThread() 是一个危险的函数,应该在最不得已的情况下才使用”。这是一个非常明白的警告。
TerminateThread() 强迫其行动目标(一个线程)结束,手段激烈而有力,甚至不允许该线程有任何“挣扎”的机会。这带来的副作用便是,线程没有机会在结束前清理自己。对线程而言,这可能导致前功尽弃。这个函数不会在目标线程中丢出一个异常情况(exception),目标线程在核心层面就被根本抹杀了。目标线程没有机会捕捉所谓的“结束请求”,并从而获得清理自己的机会。
还有另一个令人不愉快的情况。目标线程的堆栈没有被释放掉,于是可能会引起一大块内存泄漏(memory leak)。而且,任何一个与此线程有附着关系的 DLLs 也都没有机会获得“线程解除附着”的通知。
此函数唯一可以预期并依恃的是,线程 handle 将变成激发状态(译注:因为线程结束了),并且传回 dwExitCode 所指定的结束代码。
这个函数所带来的隐伏危机还包括:如果线程正进入一个 critical section 之中,该 critical section 将因此永远处于锁定状态,因为 critical section 不像mutex 那样有所谓的 "abandoned" 状态。如果目标线程正在更新一份数据结构,这份数据结构也将永远处于不稳定状态。没有任何方法可以阻止这些问题的发生。
我的结论是:离 TerminateThread() 远远地!
使用信号(Signals)
下一个似乎可行的想法是使用 signals。在 Unix 系统中,signals 是跨进程传送通告(notifications)的标准方法。在 Unix 系统中 SIGTERM 相当于“请你离开”的意思,SIGKILL 则是粗略相当于 TerminateThread()。
这个点子似乎不错,因为 C runtime library 支持标准的 signals,如SIGABRT 和 SIGINT。各种 signals 的处理函数可以利用 C 函数 signal() 设立之。
但是我很快就进入了一个死胡同。C runtime 函数中没有一个名为 kill(),而那是 Unix 系统藉以送出 signal 的操作。是有一个 raise() 啦,但只能够传送 signal 给目前的线程。
观察过 C runtime library 的源代码之后,我发现 signals 其实是利用Win32 的异常情况(exceptions)模拟的,Win32 之中并没有真正的 signals,所以这个想法也行不通。
跨越线程,丢出异常情况(Exceptions)
我真正要做的就是在目标线程中引发一个异常情况(exception)。如果有必要在结束前清理某些东西,目标线程可以设法捕捉此一异常情况,否则它可以什么都不管地直接结束自己的生命。
经过数个小时的努力之后,我可以很确定地告诉各位,Win32 API 中没有什么标准方法可以把一个异常情况丢到另一个线程中。真是不幸,因为这样的行为正是我们所需要的。
对专家而言… 关于“模拟丢出一个异常情况到另一个线程”的做法,在 Usenet 上有广泛的讨论。技术之一是利用 debugging API 写一个不合法的指令到目标线程的目前地址上。另一种做法是改变一个常用的指针,使它指向一个不合法地址,因而强迫程序代码产生一个异常情况。这两种做法都有缺点,但当你别无它途时,不妨一试。
设立一个标记
当所有方法都失败时,不妨返朴归真,回到最简单最明白的路上。Win32 核准的做法是在你的程序代码中设立一个标记,利用其值来要求线程结束自己。
这个技术有十分明显的优点,可以保证目标线程在结束之前有安全而一致的状态。其缺点也十分明显:线程需要一个 polling 机制,时时检查标记值,以决定该不该结束自己。此刻的你听到 “polling” 会不会有毛骨悚然的感觉?不不,我们并不是要写一个 busy loop 来检验标记值,我们的做法是使用一个手动重置(manual-reset)的 event 对象。Worker 线程可以检查该 event 对象的状态或是等待它,视情况而定。
结束一个线程,听起来好容易,但是结束程序必须按次序进行,以避免发生 race conditions。让程序依次序进行是非常重要的,特别是在程序要结束之前。结束一个程序就好像拆除一栋建筑物一样,在你以推土机轧平它之前,你必须确定每一个人都安全离开了屋子。结束一个程序也是这样,每一个线程都被迫结束,不管它进行到哪里。
让我们看一个简单的例子。列表5-1 的范例程序中,THRDTERM 产生两个线程,周期性地检查一个 event 对象,以决定要不要结束自己。程序代码非常类似第3章的 BUSY2。
列表5-1 THRDTERM—干净地结束一个线程
#0001 /*
#0002 * ThrdTerm.c
#0003 *
#0004 * Sample code for "Multithreading Applications in Win32"
#0005 * This is from Chapter 5, Listing 5-1
#0006 *
#0007 * Demonstrates how to request threads to exit.
#0008 *
#0009 * Build command: cl /MD ThrdTerm.c
#0010 */
#0011
#0012 #define WIN32_LEAN_AND_MEAN
#0013 #include <stdio.h>
#0014 #include <stdlib.h>
#0015 #include <windows.h>
#0016 #include <time.h>
#0017 #include "MtVerify.h"
#0018
#0019 DWORD WINAPI ThreadFunc(LPVOID);
#0020
#0021 HANDLE hRequestExitEvent = FALSE;
#0022
#0023 int main()
#0024 {
#0025 HANDLE hThreads[2];
#0026 DWORD dwThreadId;
#0027 DWORD dwExitCode = 0;
#0028 int i;
#0029
#0030 hRequestExitEvent = CreateEvent(
#0031 NULL, TRUE, FALSE, NULL);
#0032
#0033 for (i=0; i<2; i++)
#0034 MTVERIFY( hThreads[i] = CreateThread(NULL,
#0035 0,
#0036 ThreadFunc,
#0037 (LPVOID)i,
#0038 0,
#0039 &dwThreadId )
#0040 );
#0041
#0042 // Wait around for awhile, make
#0043 // sure the thread is running.
#0044 Sleep(1000);
#0045
#0046 SetEvent(hRequestExitEvent);
#0047 WaitForMultipleObjects(2, hThreads, TRUE, INFINITE);
#0048
#0049 for (i=0; i<2; i++)
#0050 MTVERIFY( CloseHandle(hThreads[i]) );
#0051
#0052 return EXIT_SUCCESS;
#0053 }
#0054
#0055
#0056 DWORD WINAPI ThreadFunc(LPVOID p)
#0057 {
#0058 int i;
#0059 int inside = 0;
#0060
#0061 UNREFERENCED_PARAMETER(p);
#0062
#0063 /* Seed the random-number generator */
#0064 srand( (unsigned)time( NULL ) );
#0065
#0066 for (i=0; i<1000000; i++)
#0067 {
#0068 double x = (double)(rand())/RAND_MAX;
#0069 double y = (double)(rand())/RAND_MAX;
#0070 if ( (x*x + y*y) <= 1.0 )
#0071 inside++;
#0072 if(WaitForSingleObject(hRequestExitEvent, 0) != WAIT_TIMEOUT)
#0073 {
#0074 printf("Received request to terminate\n");
#0075 return (DWORD)-1;
#0076 }
#0077 }
#0078 printf("PI = %.4g\n", (double)inside / i * 4);
#0079 return 0;
#0080 }
首先请注意,event 对象已经被用来取代一个简单的全局变量了。这个例子并不一定需要 event 对象,但如果我们使用它,worker 线程就能够在必要时候等待之。例如 worker 线程可以利用 event 对象来等待一个 Internetsocket 的连接成功,或是等待用户发出离开的请求。我们只要把上述 worker线程中的 WaitForSingleObject() 改为 WaitForMultipleObjects() 即可。
第二个要注意的是,所有线程共用同一个 event 对象。如果程序尝试要结束,没有必要再为每一个线程产生一个各别通告机制。因为所有的线程都必须立刻被通告。其他情况下可能需要更好的控制。
最后一点,请注意 main() 所代表的主线程,有一个 WaitForMultipleObjects()操作,等待所有的线程 handles。等待线程 handles 变成激发状态,可以保证线程都已经安全地离开了。虽然本例是无穷等待,但商业软件可能会设一个上限值,例如 15 秒或 30 秒,通常那已经足以表示线程失去了反应。