【多线程】学习3
预备知识:
volatile关键字详解
volatile总是与优化有关,编译器有一种技术叫做数据流分析,分析程序中的变量在哪里赋值、在哪里使用、在哪里失效,分析结果可以用于常量合并,常量传播等优化,进一步可以消除一些代码。但有时这些优化不是程序所需要的,这时可以用volatile关键字禁止做这些优化。
1.volatile的本意是“易变的” 因为访问寄存器要比访问内存单元快的多,所以编译器一般都会作减少存取内存的优化,但有可能会读脏数据。当要求使用volatile声明变量值的时候,系统总是重新从它所在的内存读取数据,即使它前面的指令刚刚从该处读取过数据。精确地说就是,遇到这个关键字声明的变量,编译器对访问该变量的代码就不再进行优化,从而可以提供对特殊地址的稳定访问;如果不使用valatile,则编译器将对所声明的语句进行优化。(简洁的说就是:volatile关键词影响编译器编译的结果,用volatile声明的变量表示该变量随时可能发生变化,与该变量有关的运算,不要进行编译优化,以免出错)
2.看两个事例:
1>告诉compiler不能做任何优化
比如要往某一地址送两指令:
int *ip =...;
//设备地址
*ip = 1; //第一个指令
*ip = 2; //第二个指令
以上程序compiler可能做优化而成:
int *ip = ...;
*ip = 2;
结果第一个指令丢失。如果用volatile,
compiler就不允许做任何的优化,从而保证程序的原意:
volatile int *ip = ...;
*ip = 1;
*ip =
2;
即使你要compiler做优化,它也不会把两次付值语句间化为一。它只能做其它的优化。
更多:http://blog.csdn.net/tigerjibo/article/details/7427366
----------------------------------------------------------------------------------------------------------------
下面内容来自:http://blog.csdn.net/morewindows/article/details/7429155
为了描述方便和代码简洁起见,我们可以只输出最后的报数结果来观察程序是否运行出错。这也非常类似于统计一个网站每天有多少用户登录,每个用户登录用一个线程模拟,线程运行时会将一个表示计数的变量递增。程序在最后输出计数的值表示有今天多少个用户登录,如果这个值不等于我们启动的线程个数,那显然说明这个程序是有问题的。下面我们增加点用户来试试,现在模拟50个用户登录,为了便于观察结果,在程序中将50个用户登录过程重复20次,代码如下:
#include<stdio.h> #include<process.h> #include<Windows.h> volatile long g_nLoginCount; unsigned int __stdcall ThreadFun(void *pPM); const int THREAD_NUM = 100; unsigned int __stdcall ThreadFun(void *pPM) { Sleep(100); g_nLoginCount++; Sleep(50); return 0; } int main() { HANDLE handle[THREAD_NUM]; int num = 20; while(num--) { g_nLoginCount = 0; for(int i = 0; i < THREAD_NUM; i++) { handle[i] = (HANDLE)_beginthreadex(NULL, 0, ThreadFun, NULL, 0, NULL); } WaitForMultipleObjects(THREAD_NUM, handle, TRUE, INFINITE); printf("有%d个用户登录后记录结果是%d\n", THREAD_NUM, g_nLoginCount); } return 0; }
现在结果水落石出,明明有50个线程执行了g_nLoginCount++;操作,但结果输出是不确定的,有可能为50,但也有可能小于50。
要解决这个问题,我们就分析下g_nLoginCount++;操作。在VS2010中,对g_nLoginCount++;这一语句打个断点。调试-窗口-反汇编,可以发现在C/C++语言中一条简单的自增语句其实是由三条汇编代码组成的,如下图所示。
讲解下这三条汇编意思:
第一条汇编将g_nLoginCount的值从内存中读取到寄存器eax中。
第二条汇编将寄存器eax中的值与1相加,计算结果仍存入寄存器eax中。
第三条汇编将寄存器eax中的值写回内存中。
这样由于线程执行的并发性,很可能线程A执行到第二句时,线程B开始执行,线程B将原来的值又写入寄存器eax中,这样线程A所主要计算的值就被线程B修改了。这样执行下来,结果是不可预知的——可能会出现50,可能小于50。(错误解释!!)
正确的解释是:
A执行到第二句,执行B,假设B执行结束后,继续执行A,其实寄存器eax是会恢复到A最后的值,这样导致的结果是线程B的执行结果被A覆盖,相当于B没有执行。(因为线程是有自己独有的寄存器集合,在线程切换的时候是会保存现场的。)
因此在多线程环境中对一个变量进行读写时,我们需要有一种方法能够保证对一个值的递增操作是原子操作——即不可打断性,一个线程在执行原子操作时,其它线程必须等待它完成之后才能开始执行该原子操作。这种涉及到硬件的操作会不会很复杂了,幸运的是,Windows系统为我们提供了一些以Interlocked开头的函数来完成这一任务(下文将这些函数称为Interlocked系列函数)。
1.增减操作
LONG __cdecl InterlockedIncrement(LONG volatile* Addend);
LONG __cdecl InterlockedDecrement(LONG volatile* Addend);
返回变量执行增减操作之后的值。
LONG __cdec InterlockedExchangeAdd(LONG volatile* Addend, LONG Value);
返回运算后的值,注意!加个负数就是减。
2.赋值操作
LONG __cdecl InterlockedExchange(LONG volatile* Target, LONG Value);
Value就是新值,函数会返回原先的值。
因此,在多线程环境下,我们对变量的自增自减这些简单的语句也要慎重思考,防止多个线程导致的数据访问出错。更多介绍,请访问MSDN上Synchronization Functions这一章节,地址为 http://msdn.microsoft.com/zh-cn/library/aa909196.aspx
在本例中只要使用InterlockedIncrement()函数就可以了。将线程函数代码改成:
unsigned int __stdcall ThreadFun(void *pPM) { Sleep(100); InterlockedIncrement((LPLONG)&g_nLoginCount); Sleep(50); return 0; }
但是把用户数改成100个后又出现了问题
相关评论: