【多线程】学习2

预备知识:

__stdcall函数调用约定的一种,函数调用约定主要约束了两件事:
  1.参数传递顺序
  2.调用堆栈由谁(调用函数或被调用函数)清理
  常见的函数调用约定:stdcall cdecl fastcall thiscall naked call
__stdcall表示
  1.参数从右向左压入堆栈
  2.函数被调用者修改堆栈
  3.函数名(在编译器这个层次)自动加前导的下划线,后面紧跟一个@符号,其后紧跟着参数的尺寸
  在win32应用程序里,宏APIENTRY,WINAPI,都表示_stdcall,非常常见。

---------------------------------------------------------------------------------------

转自http://blog.csdn.net/morewindows/article/details/7421759

CreateThread()函数是Windows提供的API接口,在C/C++语言另有一个创建线程的函数_beginthreadex(),在很多书上(包括《Windows核心编程》)提到过尽量使用_beginthreadex()来代替使用CreateThread(),这是为什么了?下面就来探索与发现它们的区别吧。

       首先要从标准C运行库与多线程的矛盾说起,标准C运行库在1970年被实现了,由于当时没任何一个操作系统提供对多线程的支持。因此编写标准C运行库的程序员根本没考虑多线程程序使用标准C运行库的情况。比如标准C运行库的全局变量errno。很多运行库中的函数在出错时会将错误代号赋值给这个全局变量,这样可以方便调试。但如果有这样的一个代码片段:

if (system("notepad.exe readme.txt") == -1)
{
    switch(errno)
    {
        ...//错误处理代码
    }
}

假设某个线程A在执行上面的代码,该线程在调用system()之后且尚未调用switch()语句时另外一个线程B启动了,这个线程B也调用了标准C运行库的函数,不幸的是这个函数执行出错了并将错误代号写入全局变量errno中。这样线程A一旦开始执行switch()语句时,它将访问一个被B线程改动了的errno。这种情况必须要加以避免!因为不单单是这一个变量会出问题,其它像strerror()、 strtok()、 tmpnam()、gmtime()、asctime()等函数也会遇到这种由多个线程访问修改导致的数据覆盖问题。

 

为了解决这个问题,Windows操作系统提供了这样的一种解决方案——每个线程都将拥有自己专用的一块内存区域来供标准C运行库中所有有需要的函数使用。而且这块内存区域的创建就是由C/C++运行库函数_beginthreadex()来负责的。下面列出_beginthreadex()函数的源代码(我在这份代码中增加了一些注释)以便读者更好的理解_beginthreadex()函数与CreateThread()函数的区别。

//_beginthreadex源码整理By MoreWindows( http://blog.csdn.net/MoreWindows )
_MCRTIMP uintptr_t __cdecl _beginthreadex(
    void *security,
    unsigned stacksize,
    unsigned (__CLR_OR_STD_CALL * initialcode) (void *),
    void * argument,
    unsigned createflag,
    unsigned *thrdaddr
)
{
    _ptiddata ptd;          //pointer to per-thread data 见注1
    uintptr_t thdl;         //thread handle 线程句柄
    unsigned long err = 0L; //Return from GetLastError()
    unsigned dummyid;    //dummy returned thread ID 线程ID号
    
    // validation section 检查initialcode是否为NULL
    _VALIDATE_RETURN(initialcode != NULL, EINVAL, 0);

    //Initialize FlsGetValue function pointer
    __set_flsgetvalue();
    
    //Allocate and initialize a per-thread data structure for the to-be-created thread.
    //相当于new一个_tiddata结构,并赋给_ptiddata指针。
    if ( (ptd = (_ptiddata)_calloc_crt(1, sizeof(struct _tiddata))) == NULL )
        goto error_return;

    // Initialize the per-thread data
    //初始化线程的_tiddata块即CRT数据区域 见注2
    _initptd(ptd, _getptd()->ptlocinfo);
    
    //设置_tiddata结构中的其它数据,这样这块_tiddata块就与线程联系在一起了。
    ptd->_initaddr = (void *) initialcode; //线程函数地址
    ptd->_initarg = argument;              //传入的线程参数
    ptd->_thandle = (uintptr_t)(-1);
    
#if defined (_M_CEE) || defined (MRTDLL)
    if(!_getdomain(&(ptd->__initDomain))) //见注3
    {
        goto error_return;
    }
#endif  // defined (_M_CEE) || defined (MRTDLL)
    
    // Make sure non-NULL thrdaddr is passed to CreateThread
    if ( thrdaddr == NULL )//判断是否需要返回线程ID号
        thrdaddr = &dummyid;

    // Create the new thread using the parameters supplied by the caller.
    //_beginthreadex()最终还是会调用CreateThread()来向系统申请创建线程
    if ( (thdl = (uintptr_t)CreateThread(
                    (LPSECURITY_ATTRIBUTES)security,
                    stacksize,
                    _threadstartex,
                    (LPVOID)ptd,
                    createflag,
                    (LPDWORD)thrdaddr))
        == (uintptr_t)0 )
    {
        err = GetLastError();
        goto error_return;
    }

    //Good return
    return(thdl); //线程创建成功,返回新线程的句柄.
    
    //Error return
error_return:
    //Either ptd is NULL, or it points to the no-longer-necessary block
    //calloc-ed for the _tiddata struct which should now be freed up.
    //回收由_calloc_crt()申请的_tiddata块
    _free_crt(ptd);
    // Map the error, if necessary.
    // Note: this routine returns 0 for failure, just like the Win32
    // API CreateThread, but _beginthread() returns -1 for failure.
    //校正错误代号(可以调用GetLastError()得到错误代号)
    if ( err != 0L )
        _dosmaperr(err);
    return( (uintptr_t)0 ); //返回值为NULL的效句柄
}

讲解下部分代码:

注1._ptiddata ptd;中的_ptiddata是个结构体指针。在mtdll.h文件被定义:

      typedef struct _tiddata * _ptiddata

微软对它的注释为Structure for each thread's data。这是一个非常大的结构体,有很多成员。本文由于篇幅所限就不列出来了。

 

注2._initptd(ptd_getptd()->ptlocinfo);微软对这一句代码中的getptd()的说明为:

      /* return address of per-thread CRT data */

      _ptiddata __cdecl _getptd(void);

对_initptd()说明如下:

      /* initialize a per-thread CRT data block */

      void __cdecl _initptd(_Inout_ _ptiddata _Ptd,_In_opt_ pthreadlocinfo _Locale);

注释中的CRT (C Runtime Library)即标准C运行库。

 

注3.if(!_getdomain(&(ptd->__initDomain)))中的_getdomain()函数代码可以在thread.c文件中找到,其主要功能是初始化COM环境。

 

由上面的源代码可知,_beginthreadex()函数在创建新线程时会分配并初始化一个_tiddata块。这个_tiddata块自然是用来存放一些需要线程独享的数据。事实上新线程运行时会首先将_tiddata块与自己进一步关联起来。然后新线程调用标准C运行库函数如strtok()时就会先取得_tiddata块的地址再将需要保护的数据存入_tiddata块中。这样每个线程就只会访问和修改自己的数据而不会去篡改其它线程的数据了。因此,如果在代码中有使用标准C运行库中的函数时,尽量使用_beginthreadex()来代替CreateThread()相信阅读到这里时,你会对这句简短的话有个非常深刻的印象,如果有面试官问起,你也可以流畅准确的回答了^_^。

 

接下来,类似于上面的程序用CreateThread()创建输出“Hello World”的子线程,下面使用_beginthreadex()来创建多个子线程:

//创建多子个线程实例
#include <stdio.h>
#include <process.h>
#include <windows.h>
//子线程函数
unsigned int __stdcall ThreadFun(PVOID pM)
{
    printf("线程ID号为%4d的子线程说:Hello World\n", GetCurrentThreadId());
    return 0;
}
//主函数,所谓主函数其实就是主线程执行的函数。
int main()
{
    printf("     创建多个子线程实例 \n");
    printf(" -- by MoreWindows( http://blog.csdn.net/MoreWindows ) --\n\n");
    
    const int THREAD_NUM = 5;
    HANDLE handle[THREAD_NUM];
    for (int i = 0; i < THREAD_NUM; i++)
        handle[i] = (HANDLE)_beginthreadex(NULL, 0, ThreadFun, NULL, 0, NULL);
    WaitForMultipleObjects(THREAD_NUM, handle, TRUE, INFINITE);
    return 0;
}

图中每个子线程说的都是同一句话,不太好看。能不能来一个线程报数功能,即第一个子线程输出1,第二个子线程输出2,第三个子线程输出3,……。要实现这个功能似乎非常简单——每个子线程对一个全局变量进行递增并输出就可以了。代码如下:

//子线程报数
#include <stdio.h>
#include <process.h>
#include <windows.h>
int g_nCount;
//子线程函数
unsigned int __stdcall ThreadFun(PVOID pM)
{
    g_nCount++;
    printf("线程ID号为%4d的子线程报数%d\n", GetCurrentThreadId(), g_nCount);
    return 0;
}
//主函数,所谓主函数其实就是主线程执行的函数。
int main()
{
    printf("     子线程报数 \n");
    printf(" -- by MoreWindows( http://blog.csdn.net/MoreWindows ) --\n\n");
    
    const int THREAD_NUM = 10;
    HANDLE handle[THREAD_NUM];

    g_nCount = 0;
    for (int i = 0; i < THREAD_NUM; i++)
        handle[i] = (HANDLE)_beginthreadex(NULL, 0, ThreadFun, NULL, 0, NULL);
    WaitForMultipleObjects(THREAD_NUM, handle, TRUE, INFINITE);
    return 0;
}

       答案是不对的,虽然这种做法在逻辑上是正确的,但在多线程环境下这样做是会产生严重的问题,下一篇《秒杀多线程第三篇 原子操作 Interlocked系列函数》将为你演示错误的结果(可能非常出人意料)并解释产生这个结果的详细原因。

posted @ 2014-10-15 10:59  匡子语  阅读(730)  评论(1编辑  收藏  举报