_beginthread 和 CreateThread 区别【转】

/*-------------------------------------------------------------------------------------------------

摘录时间    2017-03-03;
_beginthread 和 CreateThread 区别;
程序员对于Windows程序中应该用_beginthread还是CreateThread来创建线程,一直有所争论;
本文将从对CRT源代码出发探讨这个问题;

I. 起因;
今天一个朋友问我程序中究竟应该使用_beginthread还是CreateThread,并且告诉我如果使用不当可能会有内存泄漏;
其实我过去对这个问题也是一知半解,为了对朋友负责,专门翻阅了一下VC的运行库(CRT)源代码,终于找到了答案;

II. CRT;
CRT(C/C++ Runtime Library)是支持C/C++运行的一系列函数和代码的总称;
虽然没有一个很精确的定义,但是可以知道,你的main就是它负责调用的,你平时调用的诸如strlen、strtok、time、atoi之类的函数也是它提供的;
我们以Microsoft Visual.NET 2003中所附带的CRT为例;
假设你的.NET 2003安装在C:Program FilesMicrosoft Visual Studio.NET 2003中,那么CRT的源代码就在C : Program FilesMicrosoft Visual Studio.NET 2003Vc7crtsrc中;
既然有了这些实现的源代码,我们就可以找到一切解释了;

III. _beginthread / _endthread;
这个函数究竟做了什么呢?它的代码在thread.c中;
阅读代码,可以看到它最终也是通过CreateThread来创建线程的,主要区别在于,它先分配了一个_tiddata,并且调用了_initptd来初始化这个分配了的指针;
而这个指针最后会被传递到CRT的线程包装函数_threadstart中,在那里会把这个指针作为一个TLS(Thread Local Storage)保存起来,然后_threadstart会调用我们传入的线程函数,并且在那个函数退出后调用_endthread;
这里也可以看到,_threadstart用一个__try / __except块把我们的函数包了起来,并且在发生异常的时候,调用exit退出。(_threadstart和endthread的代码都在thread.c中)
这个_tiddata是一个什么样的结构呢?
它在mtdll.h中定义,它的成员被很多CRT函数所用到,譬如int _terrno,这是这个线程中的错误标志;char* _token,strtok以来这个变量记录跨函数调用的信息...
那么_endthread又做了些什么呢?
除了调用浮点的清除代码以外,它还调用了_freeptd来释放和这个线程相关的tiddata。也就是说,在 _beginthread里面分配的这块内存,以及在线程运行过程中其它CRT函数中分配并且记录在这个内存结构中的内存,在这里被释放了。

通过上面的代码,我们可以看到,如果我使用_beginthread函数创建了线程,它会为我创建好CRT函数需要的一切,并且最后无需我操心,就可以把清除工作做得很好;
可能唯一需要注意的就是,如果需要提前终止线程,最好是调用_endthread或者是返回,而不要调用ExitThread,因为这可能造成内存释放不完全;
同时我们也可以看出,如果我们用CreateThread函数创建了线程,并且不对C运行库进行调用(包括任何间接调用),就不必担心什么问题了;

IV. CreateThread和CRT
或许有人会说,我用CreateThread创建线程以后,我也调用了C运行库函数,并且也使用ExitThread退出了,可是我的程序运行得好好的,既没有因为CRT没有初始化而崩溃,也没有因为忘记调用 _endthread而发生内存泄漏.
这是为什么呢,让我们继续我们的CRT之旅。
假设我用CreateThread创建了一个线程,我调用 strtok函数来进行字符串处理,这个函数肯定是需要某些额外的运行时支持的。strtok的源代码在strtok.c中。
从代码可见,在多线程情况下,strtok的第一句有效代码就是_ptiddata ptd = _getptd(),它通过这个来获得当前的ptd.
可是我们并没有通过_beginthread来创建ptd,那么一定是_getptd捣鬼了。打开 tidtable.c,可以看到_getptd的实现,果然,它先尝试获得当前的ptd,如果不能,就重新创建一个。因此,后续的CRT调用就安全了。
可是这块ptd最终又是谁释放的呢?打开dllcrt0.c,可以看到一个DllMain函数。在VC中,CRT既可以作为一个动态链接库和主程序链接,也可以作为一个静态库和主程序链接,这个在Project Setting->Code Generations里面可以选。
当CRT作为DLL链接到主程序时,DllMain就是CRT DLL的入口。Windows的DllMain可以由四种原因调用:Process Attach / Process Detach / Thread Attach / Thread Detach;
最后一个,也就是当线程函数退出后但是线程还没有销毁前,会在这个线程的上下文中用Thread Detach调用DllMain,这里,CRT做了一个_freeptd(NULL),也就是说,如果有ptd,就free掉;
所以说,恰巧没有发生内存泄漏是因为你用的是动态链接的CRT。
于是我们得出了一个更精确的结论,如果我没有使用那些会使用_getptd的CRT函数,使用CreateThread就是安全的。

V. 使用ptd的函数;
那么,究竟那些函数使用了_getptd呢?很多!在CRT目录下搜索_getptd,你会发觉很多意想不到的函数都用到了它,除了strtok、rand这类需要保持状态的,还有所有的字符串相关函数,因为它们要用到ptd中的locale信息;
所有的mbcs函数,因为它们要用到ptd中的mbcs信息...;

VI. 测试代码;
最下面是一段测试代码(leaker中用到了atoi,它需要ptd);
如果你用VC的多线程+静态链接CRT选项去编译这个程序,并且尝试打开1、2、3之中的一行,你会发觉只有2打开的情况下,程序才会发生内存泄漏(可以在Task Manager里面明显的观察到);
3之所以不会出现内存泄漏是因为主动调用了_endthread;

VII. 总结;
如果你使用了DLL方式链接的CRT库,或者你只是一次性创建少量的线程,那么你或许可以采取鸵鸟策略,忽视这个问题;
上面一节代码中第3种方法基于对CRT库的了解,但是并不保证这是一个好的方法,因为每一个版本的VC的CRT可能都会有些改变;
看来,除非你的头脑清晰到可以记住这一切,或者你可以不厌其烦的每调用一个C函数都查一下CRT代码,否则总是使用 _beginthread(或者它的兄弟_beginthreadex)是一个不错的选择;

VIII. 后记;
网友condor指出本文的一个错误:在dllcrt0.c 中,DllMain的Thread Detach所释放的ptd,其实是dllcrt0.c的DllMain中的Thread Attach所创建的;
也就是说,当你用CRT DLL的时候,DllMain对线程做了一切初始化 / 清除工作。我查看源代码,thread.c中的_threadstart函数,在设置TLS之前做了检查,这其实就是为了避免重复设置导致的内存泄漏;

-------------------------------------------------------------------------------------------------*/


// MyThread: my_thread.h
/*-------------------------------------------------------------------------------------------------

#include <process.h>
#include <iostream>
#include <CRTDBG.H>
#include <wtypes.h>

#ifdef MYTHREAD_EXPORTS
#define MYTHREAD_API  _declspec(dllexport)
#else
#define MYTHREAD_API  _declspec(dllimport)
#endif

extern volatile bool threadStarted = false;

MYTHREAD_API void my_printf();

MYTHREAD_API DWORD __stdcall CreateThreadFunc(LPVOID);

MYTHREAD_API DWORD __stdcall CreateThreadFuncWithEndThread(LPVOID);

MYTHREAD_API void __cdecl beginThreadFunc(LPVOID);

-------------------------------------------------------------------------------------------------*/


// MyThread: my_thread.cpp
/*-------------------------------------------------------------------------------------------------

#include "my_thread.h"

void my_printf()
{
    std::cout << atoi("0") << std::endl;
}

DWORD __stdcall CreateThreadFunc(LPVOID)
{
    my_printf();
    threadStarted = false;
    return 0;
}

DWORD __stdcall CreateThreadFuncWithEndThread(LPVOID)
{
    my_printf();
    threadStarted = false;
    _endthread();
    return 0;
}

void __cdecl beginThreadFunc(LPVOID)
{
    my_printf();
    threadStarted = false;
}

-------------------------------------------------------------------------------------------------*/


// Thread_Test: thread_test.cpp
/*-------------------------------------------------------------------------------------------------

#include "my_thread.h"

#define BEGINTHREAD_TEST
#define CREATETHREAD_TEST
#define CREATETHREAD_WITHENDTHREAD_TEST

int main()
{
    while (1)
    {
        while (threadStarted)
        {
            Sleep(5);
        }
        threadStarted = true;

#ifdef BEGINTHREAD_TEST
        _beginthread( beginThreadFunc, 0, 0 );//1
#endif

#ifdef CREATETHREAD_TEST
        CreateThread(NULL, 0, CreateThreadFunc, 0, 0, 0);//2
#endif

#ifdef CREATETHREAD_WITHENDTHREAD_TEST
        CreateThread( NULL, 0, CreateThreadFuncWithEndThread, 0, 0, 0 );//3
#endif

        break;
    }
    getchar();
    return 0;
}

-------------------------------------------------------------------------------------------------*/

 

posted on 2017-03-03 13:44  仲达超  阅读(3387)  评论(1编辑  收藏  举报

导航