C#线程 访问资源同步简介
在多线程应用(一个或多个处理器)的计算中会使用到同步这个词。实际上,这些应用程序的特点就是它们拥有多个执行单元,而这些单元在访问资源的时候可能会发生冲突。线程间会共享同步对象,而同步对象的目的在于能够阻塞一个或多个线程,直到另一个线程使得某个特定条件得到满足。
我们将看到,存在多种同步类与同步机制,每种制针对一个或一些特定的需求。如果要利用同步构建一个复杂的多线程应用程序,那么很有必要先掌握本章的内容。我们将在下面的内容中尽力区分他们,尤其要指出那些在各个机制间最微妙的区别。
合理地同步一个程序是最精细的软件开发任务之一,单这一个主题就足以写几本书。在深入到细节之前,应该首先确认使用同步是否不可避免。通常,使用一些简单的规则可以让我们远离同步问题。在这些规则中有线程与资源的亲缘性规则,我们将在稍后介绍。
应该意识到,对程序中资源的访问进行同步时,其难点来自于是使用细粒度锁还是粗粒度锁这个两难的选择。如果在访问资源时采用粗粒度的同步方式,虽然可以简化代码但是也会把自己暴露在争用瓶颈的问题上。如果粒度过细,代码又会变的很复杂,以至于维护工作令人生厌。然后又会遇上死锁和竞态条件这些在下面章节将要介绍的问题。
因此在我们开始谈论有关同步机制之前,有必要先了解一下有关竞态条件和死锁的概念。
5.4.1 竞态条件
竞态条件指的是一种特殊的情况,在这种情况下各个执行单元以一种没有逻辑的顺序执行动作,从而导致意想不到的结果。
举一个例子,线程T修改资源R后,释放了它对R的写访问权,之后又重新夺回R的读访问权再使用它,并以为它的状态仍然保持在它释放它之后的状态。但是在写访问权释放后到重新夺回读访问权的这段时间间隔中,可能另一个线程已经修改了R的状态。
另一个经典的竞态条件的例子就是生产者/消费者模型。生产者通常使用同一个物理内存空间保存被生产的信息。一般说来,我们不会忘记在生产者与消费者的并发访问之间保护这个空间。容易被我们忘记的是生产者必须确保在生产新信息前,旧的信息已被消费者所读取。如果我们没有采取相应的预防措施,我们将面临生产的信息从未被消费的危险。
如果静态条件没有被妥善的管理,将导致安全系统的漏洞。同一个应用程序的另一个实例很可能会引发一系列开发者所预计不到的事件。一般来说,必须对那种用于确认身份鉴别结果的布尔量的写访问做最完善的保护。如果没有这么做,那么在它的状态被身份鉴别机制设置后,到它被读取以保护对资源的访问的这段时间内,很有可能已经被修改了。已知的安全漏洞很多都归咎于对静态条件不恰当的管理。其中之一甚至影响了Unix操作系统的内核。
5.4.2 死锁
死锁指的是由于两个或多个执行单元之间相互等待对方结束而引起阻塞的情况。例如:
一个线程T1获得了对资源R1的访问权。
一个线程T2获得了对资源R2的访问权。
T1请求对R2的访问权但是由于此权力被T2所占而不得不等待。
T2请求对R1的访问权但是由于此权力被T1所占而不得不等待。
T1和T2将永远维持等待状态,此时我们陷入了死锁的处境!这种问题比你所遇到的大多数的bug都要隐秘,针对此问题主要有三种解决方案:
- 在同一时刻不允许一个线程访问多个资源。
- 为资源访问权的获取定义一个关系顺序。换句话说,当一个线程已经获得了R1的访问权后,将无法获得R2的访问权。当然,访问权的释放必须遵循相反的顺序。
- 为所有访问资源的请求系统地定义一个最大等待时间(超时时间),并妥善处理请求失败的情况。几乎所有的.NET的同步机制都提供了这个功能。
前两种技术效率更高但是也更加难于实现。事实上,它们都需要很强的约束,而这点随着应用程序的演变将越来越难以维护。尽管如此,使用这些技术不会存在失败的情况。
大的项目通常使用第三种方法。事实上,如果项目很大,一般来说它会使用大量的资源。在这种情况下,资源之间发生冲突的概率很低,也就意味着失败的情况会比较罕见。我们认为这是一种乐观的方法。秉着同样的精神,我们在19.5节描述了一种乐观的数据库访问模型。
5.5 使用volatile字段与Interlocked类实现同步
5.5.1 volatile字段
volatile字段可以被多个线程访问。我们假设这些访问没有做任何同步。在这种情况下,CLR中一些用于管理代码和内存的内部机制将负责同步工作,但是此时不能确保对该字段读访问总能读取到最新的值,而声明为volatile的字段则能提供这样的保证。在C#中,如果一个字段在它的声明前使用了volatile关键字,则该字段被声明为volatile。
不是所有的字段都可以成为volatile,成为这种类型的字段有一个条件。如果一个字段要成为volatile,它的类型必须是以下所列的类型中的一种:
- 引用类型(这里只有访问该类型的引用是同步的,访问其成员并不同步)。
- 一个指针(在不安全的代码块中)。
- sbyte、byte、short、ushort、int、uint、char、float、bool(工作在64位处理器上时为double、long与ulong)。
- 一个使用以下底层类型的枚举类型:byte、sbyte、short、ushort、int、uint(工作在64位的处理器上时为double、long与ulong)。
你可能已经注意到了,只有值或者引用的位数不超过本机整型值的位数(4或8由底层处理器决定)的类型才能成为volatile。这意味着对更大的值类型进行并发访问必须进行同步,下面我们将会对此进行讨论。
5.5.2 System.Threading.Interlocked类
经验显示,那些需要在多线程情况下被保护的资源通常是整型值,而这些被共享的整型值最常见的操作就是增加/减少以及相加。.NET Framework利用System.Threading.Interlocked类提供了一个专门的机制用于完成这些特定的操作。这个类提供了Increment()、Decrement()与Add()三个静态方法,分别用于对int或者long类型变量的递增、递减与相加操作,这些变量以引用方式作为参数传入。我们认为使用Interlocked类让这些操作具有了原子性。
下面的程序显示了两个线程如何并发访问一个名为counter的整型变量。一个线程将其递增5次,另一个将其递减5次。
例5-5
该程序输出(以非确定方式输出,意味着每执行一次显示的结果都是不同的):
如果我们不让这些线程在每次修改变量后休眠10毫秒,那么它们将有足够的时间在一个时间片中完成它们的任务,那样也就不会出现交叉操作,更不用说并发访问了。
5.5.3 Interlocked类提供的其他功能
Interlocked类还允许使用Exchange()静态方法,以原子操作的形式交换某些变量的状态。还可以使用CompareExchange()静态方法在满足一个特定条件的基础上以原子操作的形式交换两个值。
5.6 使用System.Threading.Monitor类与C#的lock关键字实现同步
以原子操作的方式完成简单的操作无疑是很重要的,但是这还远不能涵盖所有需要用到同步的事例。System.Threading.Monitor类几乎允许将任意一段代码设置为在某个时间仅能被一个线程执行。我们将这段代码称之为临界区。
5.6.1 Enter()方法和Exit()方法
Monitor类提供了Enter(object)与Exit(object)这两个静态方法。这两个方法以一个对象作为参数,该对象提供了一个简单的方式用于唯一标识那个将以同步方式访问的资源。当一个线程调用了Enter()方法,它将等待以获得访问该引用对象的独占权(仅当另一个线程拥有该权力的时候它才会等待)。一旦该权力被获得并使用,线程可以对同一个对象调用Exit()方法以释放该权力。
一个线程可以对同一个对象多次调用Enter(),只要对同一对象调用相同次数的Exit()来释放独占访问权。
一个线程也可以在同一时间拥有多个对象的独占权,但是这样会产生死锁的情况。
绝不能对一个值类型的实例调用Enter()与Exit()方法。
不管发生了什么,必须在finally子句中调用Exit()以释放所有的独占访问权。
如果在例5-5中,一个线程非要将counter做一次平方而另一个线程非要将counter乘2,我们就不得不用Monitor类去替换对Interlocked类的使用。f1()与f2()的代码将变成下面这样:
例5-6[1]
人们很容易想到用counter来代替typeof(Program),但是counter是一个值类型的静态成员。需要注意平方和倍增操作是不满足交换律的,所以counter的最终结果是非确定性的。
5.6.2 C#的lock关键字
C#语言通过lock关键字提供了一种比使用Enter()和Exit()方法更加简洁的选择。我们的程序可以改写为下面这个样子:
例5-7
和for以及if关键字一样,如果被lock关键字定义的块仅包含一条指令,就不再需要花括号。我们可以再次改写为:
使用lock关键字将引导C#编译器创建出相应的try/finally块,这样仍旧可以预期到任何可能引发的异常。可以使用Reflector或者ildasm.exe工具验证这一点。
5.6.3 SyncRoot模式
和前面的例子一样,我们通常在一个静态方法中使用Monitor类配合一个Type类的实例。同样,我们往往会在一个非静态方法中使用this关键字来实现同步。在两种情况下,我们都是通过一个在类外部可见的对象对自身进行同步。如果其他部分的代码也利用这些对象来实现自身的同步,就会出现问题。为了避免这种潜在的问题,我们推荐使用一个类型为object的名为SyncRoot的私有成员,至于该成员是静态的还是非静态的则由需要而定。
例5-8
System.Collections.ICollection接口提供了object类型的SyncRoot{get;}属性。大多数的集合类(泛型或非泛型)都实现了该接口。同样地,可以使用该属性同步对集合中元素的访问。不过在这里SyncRoot模式并没有被真正的应用,因为我们对访问进行同步所使用对象不是私有的。
例5-9
5.6.4 线程安全类
若一个类的每个实例在同一时间不能被一个以上的线程所访问,则该类称之为一个线程安全的类。为了创建一个线程安全的类,只需将我们见过的SyncRoot模式应用于它所包含的方法。如果一个类想变成线程安全的,而又不想为类中代码增加过多负担,那么有一个好方法就是像下面这样为其提供一个经过线程安全包装的继承类。
例5-10
另一种方法就是使用System.Runtime.Remoting.Contexts.SynchronizationAttribute,这点我们将在本章稍后讨论。
5.6.5 Monitor.TryEnter()方法
该方法与Enter()相似,只不过它是非阻塞的。如果资源的独占访问权已经被另一个线程占据,该方法将立即返回一个false返回值。我们也可以调用TryEnter()方法,让它以毫秒为单位阻塞一段有限的时间。因为该方法的返回结果并不确定,并且当获得独占访问权后必须在finally子句中释放该权力,所以建议当TryEnter()失败时立即退出正在调用的函数:
例5-11[2]
5.6.6 Monitor类的Wait()方法, Pulse()方法以及PulseAll()方法
Wait()、Pulse()与PulseAll()方法必须在一起使用并且需要结合一个小场景才能被正确理解。我们的想法是这样的:一个线程获得了某个对象的独占访问权,而它决定等待(通过调用Wait())直到该对象的状态发生变化。为此,该线程必须暂时失去对象独占访问权,以便让另一个线程修改对象的状态。修改对象状态的线程必须使用Pulse()方法通知那个等待线程修改完成。下面有一个小场景具体说明了这一情况。
- 拥有OBJ对象独占访问权的T1线程,调用Wait(OBJ)方法将它自己注册到OBJ对象的被动等待列表中。
- 由于以上的调用,T1失去了对OBJ的独占访问权。因此,另一个线程T2通过调用Enter(OBJ)获得OBJ的独占访问权。
- T2最终修改了OBJ的状态并调用Pulse(OBJ)通知了这次修改。该调用将导致OBJ被动等待列表中的第一个线程(在这里是T1)被移到OBJ的主动等待列表的首位。而一旦OBJ的独占访问权被释放,OBJ主动等待列表中的第一个线程将被确保获得该权力。然后它就从Wait(OBJ)方法中退出等待状态。
- 在我们的场景中,T2调用Exit(OBJ)以释放对OBJ的独占访问权,接着T1恢复访问权并从Wait(OBJ)方法中退出。
- PulseAll()将使得被动等待列表中的线程全部转移到主动等待列表中。注意这些线程将按照它们调用Wait()的顺序到达非阻塞态。
如果Wait(OBJ)被一个调用了多次Enter(OBJ)的线程所调用,那么该线程将需要调用相同次数的Exit(OBJ)以释放对OBJ的访问权。即使在这种情况下,另一个线程调用一次Pulse(OBJ)就足以将第一个线程变成非阻塞态。
下面的程序通过ping与pong两个线程以交替的方式使用一个ball对象的访问权来演示该功能。
例5-12
该程序输出(以不确定的方式):
pong线程没有结束并且仍然阻塞在Wait()方法上。由于pong线程是第二个获得ball对象的独占访问权的,所以才导致了该结果。
5.7 使用Win32对象同步:互斥体、事件与信号量
System.Threading.WaitHandle抽象基类提供了三个继承类,那些在Win32环境下使用过同步技术的用户都十分了解它们的用途。
- Mutex类(mutex这个词是MUTual Exclusion的缩写)。
- AutoResetEvent类定义了一个会自动重置的事件。ManualResetEvent类定义了一个需要手动重置的事件。这两个类继承于代表一般事件的EventWaitHandle类。
- Semaphore类。
WaitHandle类和它的继承类有一个特点,它们都重写了WaitOne()方法并实现了WaitAll()、WaitAny()与SignalAndWait()静态方法。它们分别允许等待对象收到信号或者数组中的所有对象收到信号,以等待数组中至少一个对象收到信号以及向一个对象发出信号并等待另一个对象。与Monitor类和Interlocked类相反,以上这些类必须被实例化后才能使用。因此这里所要考虑的对象不是被同步的对象,而是用于同步的对象。也就意味着作为参数传递给WaitAll()、WaitAny()以及SignalAndWait()静态方法的对象本身全部都是互斥体、事件或者信号量。
5.7.1 共享Win32同步对象
Monitor类与WaitHandle的继承类各自所提倡的同步模型,还存在一个大的差别值得注意。使用Monitor类仅限于一个单独的进程中,而WaitHandle类的继承类调用的是非托管的Win32对象,它们可以被处在同一机器上的多个进程所访问。因此,WaitHandle类的继承类提供了某些接受一个字符串参数的构造函数,该字符串用于命名同步对象。这些类还提供了OpenExisting(string)方法用于获得一个已存在的某个特定名称的同步对象的引用。
由于WaitHandle类继承于MarshalByRefObject,所以我们还可以做得更多。利用.NET的Remoting技术,这样一个同步对象甚至可以被不同机器上的多个进程所共享。
在6.10.1节,我们解释了如何使用System.Security.AccessControl命名空间下的Mutex- Security、EventWaitHandleSecurity以及SemaphoreSecurity类型来操纵Windows赋予同步对象的访问权。
5.7.2 互斥体
就功能而言,互斥体(mutex)的使用和管程的使用很接近,不过有一点区别。
- 我们可以在同一台机器甚至远程机器上的多个进程中使用同一个互斥体。
- 使用管程无法等待多个对象。
- Mutex类没有Monitor类中的Wait()、Pulse()以及PulseAll()方法所提供的功能。
我们知道,如果需要同步的访问处在一个进程中,应该考虑使用Monitor类代替互斥体因为它的效率更高。
下面的程序展示了使用一个有名互斥体来保护对资源的访问,该互斥体被同一台机器的多个进程共享。被共享的资源是一个文件,每个程序的实例将在文件中写入10行文字。
例5-13
注意,使用WaitOne()方法会阻塞当前线程,直到获得互斥体,使用ReleaseMutex()方法则可以释放互斥体。
在本程序中new Mutex不一定意味着创建一个互斥体,可能是创建一个对互斥体"MutexTest"的引用。只有当该互斥体不存在的时候,操作系统才会创建它。同样,只有当没有其他进程引用互斥体时,Close()方法才会真正销毁它。
对于那些习惯在Win32环境中使用命名互斥体技术来避免在同一台机器上运行两个相同程序的用户,应该知道在.NET中提供了更好的方法,参见5.2.4节。
5.7.3 事件
相比目前所看到的同步机制,事件(event)并没有显式定义一个在给定时间属于某个线程的某个资源的概念。事件被用于在线程间传递通知,该通知表示“某个事件发生了”。被关注的事件会与System.Threading.AutoResetEvent和System.Threading.ManualResetEvent这两个事件类的一个实例关联。这两个类都继承于System.Threading.EventWaitHandle类。一个EventWaitHandle的实例可以被System.Threading.EventResetMode枚举类型中AutoReset或ManualReset两者之一的值初始化,这也意味着你不是非要直接创建其中的一个继承类[3]。
具体说来,一个线程通过调用代表事件的对象的WaitOne()这个阻塞方法[4]来等待一个事件被触发。另一个线程调用事件对象的Set()方法以触发事件从而使得第一个线程继续执行。
自动重置事件与手动重置事件的区别在于,后者需要调用Reset()方法将事件返回到非活动状态。
手动重置与自动重置的区别可能远比你想象的要大。如果几个线程在等待同一个自动重置的事件,那么该事件需要为每个线程都触发一次。而在手动重置的情况下只需要简单的触发一次事件就可以让所有的阻塞线程继续执行。
下面的程序创建了两个线程t0和t1,它们以不同的速度增加自己的计数器。当t0的计数器达到2,它就触发events[0]事件;当t1的计数器达到3,它就触发events[1]事件。主线程等待两个事件都被触发以显式一条消息。
例5-14
该程序输出:
5.7.4 信号量
一个System.Threading.Semaphore类的实例可用来限制对一个资源的并发访问数。你可以想象一个停车场的入口大门只包含一定数量的停车位。只有当停车场中还有空位的时候它才会打开。同样,当调用WaitOne()方法试图进入一个信号量(semaphore)的时候,如果当时已经进入的线程的数量达到某个最大值时,该线程就会被阻塞。这个最大的入口的数量由Semaphore类的构造函数的第二个参数设定,而第一个参数则定义了初始时的入口数量。如果第一个参数的值小于第二个,线程在调用构造函数时会自动地占据二者差值数量的入口。最后这点也说明了同一个线程可以占据同一个信号量的多个入口。
下面这个例子通过启动3个线程让它们定时的尝试进入一个最大入口数为5的信号量,来举例说明上述内容。主线程占据了该信号量的三个入口,迫使另外3个线程去共享剩下的2个入口。
例5-15
下面是程序的输出。我们看到其中并发工作的子线程从未超过2个。
5.8 利用System.Threading.ReaderWriterLock类实现同步
System.Threading.ReaderWriterLock类实现了多用户读/单用户写的同步访问机制。与Monitor类或Mutex类提供的独占访问模型相反,该机制考虑到一个线程在访问资源的时候可能仅仅需要读或者写这一事实。如果某一时刻尚未获得写访问权,则此时可以获得读访问权。如果某一时刻没有任何对资源进行访问的迹象,则此时可以获得写访问权。此外,如果一个写访问权已被申请而尚未获得,那么所有新的读访问将暂时搁置。
如果该模型适用,那么相对于Monitor类或者Mutex类,它总是一个更好的选择。事实上,独占访问模型不允许任何形式的并发访问以致于效率总是不高。此外,我们应该注意到,应用程序通常在访问资源的时候更多的是读而不是写。
和互斥体以及事件一致,但与Monitor类不同的是,ReaderWriterLock类必须在使用前被初始化。必须从用于同步的对象的角度去考虑,而不是被同步的对象。
下面是一个展示使用该类的例子,不过这里并没有使用到它的全部功能。实际上,Downgrade- FromWriterLock()以及UpgradeToWriterLock()方法允许我们请求更换访问权而不释放当前的访问。
例5-16
该程序输出:
5.9 利用System.Runtime.Remoting.Contexts.Synchronization- Attribute实现同步
将System.Runtime.Remoting.Contexts.SynchronizationAttribute应用于某个类后,该类的实例无法被多个线程同时访问。我们说,这样的类是线程安全的。
为了获得上述的特性,被应用该attribute的类必须是上下文绑定的。换句话说,它必须继承于System.ContextBoundObject类。上下文绑定的含义参见22.15节。
下面这个例子演示了如何应用该特性。
例5-17
该程序输出:
5.9.1 同步域简介
为了更好地阅读下面的内容,必须理解以下概念:
- AppDomain(参见4.1节),
- .NET的上下文以及上下文绑定/上下文灵活对象(参见22.15节),
- 消息接收器(参见13.5节)。
同步域是一个完全由CLR接管的实体。该领域包含了一个或多个.NET上下文,因而也将这些上下文中的对象包含其中。一个.NET上下文最多属于一个同步域。此外,同步域的概念要比AppDomain的概念窄。图5-2展示了进程、AppDomain、同步上下文[5]、.NET上下文和.NET对象的关系。
图5-2 进程、AppDomain、同步域、.NET上下文和.NET对象
由于我们正在讨论同步以及多线程应用程序,所以有必要牢记AppDomain与进程中的线程这两个概念是正交的。事实上,一个线程可以自由穿越两个AppDomain之间的边界,例如,只需让处在DB AppDomain的对象B调用处在DA AppDomain的对象A就实现了穿越。此外,一个AppDomain的代码可以被零个,一个或多个线程同时执行。
同步域之所以有意义就在于它不能被多个线程所共享。换句话说,一个处在同步域中的对象的方法是不能被多个线程同时执行的。这也意味着在任一时刻,最多只有一个线程处于同步域中。我们接着谈到对同步域的独占访问权。这种独占访问权的管理还是由CLR负责的。
5.9.2 System.Runtime.Remoting.Contexts.Synchronization与同步域
你可能已经猜到,System.Runtime.Remoting.Contexts.SynchronizationAttribute实际上是用来告诉CLR何时创建一个同步域以及如何定义它的边界。这些设置是在声明System.Runtime. Remoting.Contexts.SynchronizationAttribute的时候完成的。声明attribute时使用下面四个值其中之一:NOTSUPPORTED、SUPPORTED、REQUIRED或REQUIRES_NEW。注意REQUIRED是默认值。
AppDomain的成员在一个对象创建另一个对象的时候发生联系。这里我们谈到了创建者对象,但是要考虑到一个对象也可以由一个静态方法创建,而静态方法的执行可能是由一个处在同步域的对象的调用引起的。我们知道在这种情况下,该静态方法为AppDomain增加了新的成员,因此也扮演了创建者对象的角色。下表是对可能出现的四种特性的解释。
这些特性可归纳如下:
5.9.3 重入与同步域
在同步域D中,当拥有独占访问权的T1线程调用了一个处在D外的对象的方法后,CLR将会有两种表现:
- 要么CLR允许另一个线程T2获得对D的独占访问权。在这种情况下,T1可能需要在它调用D外的对象之后进入等待状态,直到T2释放了对D的独占访问权。在这里出现了重入(Reentrancy),因为T1请求再次进入D,如图5-3所示。
- 要么T1仍然占据对D的独占访问权。在这种情况下,另一个希望调用D中对象的方法的线程T2需要等待T1释放它对D的独占访问权。
调用静态方法不会被认为是同步域外的调用。
图5-3 同步域中的重入
某些System.Runtime.Remoting.Contexts.Synchronization类的某些构造函数接受一个布尔值作为参数。该布尔值定义了当调用当前同步域外的对象时是否允许发生重入。当该布尔值设为真时,允许发生重入。如果所有的对象都允许重入,只需要将同步域中遇到的第一个对象的synchro- nizationAttribute的重入参数设为真。
下面的例子用代码说明了图5-3:
例5-18
该程序输出如下:
显然如果我们对Foo1禁用重入,程序将输出如下:
重入用于优化对资源的管理,因为它可以全面缩短线程在同步域中使用独占访问权的时间。尽管如此,默认情况下重入功能并没有被激活。事实上,如果发生重入,我们对同步域的概念的理解会有很大的改变。更糟的是,没适当的调整就激活重入功能可能会产生死锁现象。由于以上原因,建议不要使用重入,除非特别需要。
5.9.4 另一个名为Synchronization的attribute
.NET Framework在另一个命名空间提供了另外一个同名的attribute。System.EnterpriseServices. SynchronizationAttribute拥有同样的目的只不过在内部使用了COM+中用于同步的企业服务。基于以下两个原因,优先选择使用System.Runtime.Remoting.Contexts.SynchronizationAttribute。
- 它的使用更加高效。
- 相较于COM+的版本,该机制支持异步调用。