揭示同步块索引（上）：从lock开始

大家都知道引用类型对象除实例字段的开销外，还有两个字段的开销：类型指针和同步块索引（SyncBlockIndex）。同步块索引这个东西比起它的兄弟类型指针更少受人关注，显得有点冷落，其实此兄功力非凡，在CLR里可谓叱咤风云，很多功能都要借助它来实现。接下来我会用三篇来介绍同步块索引在.NET中的所作所为。
既然本章副标题是从lock开始，那我就举几个lock的示例：

代码1

   1: public class Singleton

   2: {

   3:     private static object lockHelper = new object();

   4:     private static Singleton _instance = null;

   5:     public static Singleton Instance

   6:     {

   7:         get

   8:         {

   9:             lock(lockHelper)

  10:             {

  11:                 if(_instance == null)

  12:                     _instance = new Singleton();

  13:             }

  14:             return _instance;

  15:         }

  16:     }

  17: }

代码2

   1: public class Singleton

   2: {

   3:     private static Singleton _instance = null;

   4:     public static Singleton Instance

   5:     {

   6:         get

   7:         {

   8:             object lockHelper = new object();

   9:             lock(lockHelper)

  10:             {

  11:                 if(_instance==null)

  12:                     _instance = new Singleton();

  13:             }

  14:             return _instance;

  15:         }

  16:     }

  17: }

代码3

   1: public class Singleton

   2: {

   3:     private static Singleton _instance = null;

   4:     public static Singleton Instance

   5:     {

   6:         get

   7:         {

   8:             lock(typeof(Singleton))

   9:             {

  10:                 if(_instance==null)

  11:                     _instance = new Singleton();

  12:             }

  13:             return_instance;

  14:         }

  15:     }

  16: }

代码4

   1: public void DoSomething()

   2: {

   3:     lock(this)

   4:     {

   5:         //dosomething

   6:     }

   7: }

上面四种代码，对于加锁的方式来说（不讨论其他）哪一种是上上选？对于这个问题的答案留在本文最后解答。

让我们先来看看在Win32的时代，我们如何做到CLR中的lock的效果。在Win32时，Windows为我们提供了一个CRITICAL_SECTION结构，看看上面的单件模式，如果使用CRITICAL_SECTION的方式如何实现？

   1: class Singleton

   2: {

   3:     private:

   4:         CRITICAL_SECTIONg_cs;

   5:         static Singleton _instance = NULL;

   6:     public:

   7:         Singleton()

   8:         {

   9:             InitializeCriticalSection(&g_cs);

  10:         }

  11:         static Singleton GetInstance()

  12:         {

  13:             EnterCriticalSection(&g_cs);

  14:             if(_instance!=NULL)

  15:                 _instance=newSingleton();

  16:             LeaveCriticalSection(&g_cs);

  17:             return_instance;

  18:         }

  19:         ~Singleton()

  20:         {

  21:             DeleteCriticalSection(&g_cs);

  22:         }

  23: }

Windows提供四个方法来操作这个CRITICAL_SECTION，在构造函数里我们使用InitializeCriticalSection这个方法初始化这个结构，它知道如何初始化CRITICAL_SECTION结构的成员，当我们要进入一个临界区访问共享资源时，我们使用EnterCriticalSection方法，该方法首先会检查CRITICAL_SECTION的成员，检查是否已经有线程进入了临界区，如果有，则线程会等待，否则会设置CRITICAL_SECTION的成员，标识出本线程进入了临界区。当临界区操作结束后，我们使用LeaveCriticalSection方法标识线程离开临界区。在Singleton类的析构函数里，我们使用DeleteCriticalSection方法销毁这个结构。整个过程就是如此。
我们可以在WinBase.h里找到CRITICAL_SECTION的定义：

typedef RTL_CRITICAL_SECTION CRITICAL_SECTION;

可以看到，CRITICAL_SECTION实际上就是RTL_CRITICAL_SECTION，而RTL_CRITICAL_SECTION又是在WinNT.h里定义的：

   1: typedef struct _RTL_CRITICAL_SECTION{

   2: PRTL_CRITICAL_SECTION_DEBUGDebugInfo;

   3: //

   4: //Thefollowingthreefieldscontrolenteringandexitingthecritical

   5: //sectionfortheresource

   6: //

   7: LONG LockCount;

   8: LONG RecursionCount;

   9: HANDLE OwningThread;//fromthethread'sClientId->UniqueThread

  10: HANDLE LockSemaphore;

  11: ULONG _PTRSpinCount;//forcesizeon64-bitsystemswhenpacked

  12: }RTL_CRITICAL_SECTION,*PRTL_CRITICAL_SECTION;

从上面的定义和注释，聪明的你肯定知道Windows API提供的这几个方法是如何操作CRITICAL_SECTION结构的吧。在这里我们只需要关注OwningThread成员，当有线程进入临界区的时候，这个成员就会指向当前线程的句柄。

说了这么多，也许有人已经厌烦了，不是说好说lock么，怎么说半天Win32 API呢，实际上CLR的lock与Win32 API实现方式几乎是一样的。但CLR并没有提供CRITICAL_SECTION结构，不过CLR提供了同步块，CLR还提供了System.Threading.Monitor类。

实际上使用lock的方式，与下面的代码是等价的：

   1: try{

   2:     Monitor.Enter(obj);

   3:     //…

   4: }finally{

   5:     Monitor.Exit(obj);

   6: }

（以下内容只限制在本文，为了简单，有的说法很片面，更详细的内容会在后面两篇里描述）

当CLR初始化的时候，CLR会初始化一个SyncBlock的数组，当一个线程到达Monitor.Enter方法时，该线程会检查该方法接受的参数的同步块索引，默认情况下对象的同步块索引是一个负数(实际上并不是负数，我这里只是为了叙说方便)，那么表明该对象并没有一个关联的同步块，CLR就会在全局的SyncBlock数组里找到一个空闲的项，然后将数组的索引赋值给该对象的同步块索引，SyncBlock的内容和CRITICAL_SECTION的内容很相似，当Monitor.Enter执行时，它会设置SyncBlock里的内容，标识出已经有一个线程占用了，当另外一个线程进入时，它就会检查SyncBlock的内容，发现已经有一个线程占用了，该线程就会等待，当Monitor.Exit执行时，占用的线程就会释放SyncBlock，其他的线程可以进入操作了。

好了，有了上面的解释，我们现在可以判断本文前面给出的几个代码，哪一个是上上选呢？

对于代码2，锁定的对象是作为一个局部变量，每个线程进入的时候，锁定的对象都会不一样，它的SyncBlock每一次都是重新分配的，这个根本谈不上什么锁定不锁定。

对于代码3，一般说来应该没有什么事情，但这个操作却是很危险的，typeof(Singleton)得到的是Singleton的Type对象，所有Singleton实例的Type都是同一个，Type对象也是一个对象，它也有自己的SyncBlock，Singleton的Type对象的SyncBlock在程序中只会有一份，为什么说这种做法是危险的呢？如果在该程序中，其他毫不相干的地方我们也使用了lock(typeof(Singleton))，虽然它和这里的锁定毫无关系，但是只要一个地方锁定了，各个地方的线程都会在等待。

对于代码4，实际上代码4的性质和代码3差不多，如果有一个地方使用了DoSomething方法所在类的实例进行lock，而且恰好如this是同一个实例，那么两个地方就会互斥了。

由此看来只有代码1是上上选，之所以是这样，是因为代码1将锁定的对象作为私有字段，只有这个对象内部可以访问，外部无法锁定。上面只是从文字上叙说，也许你觉得证据不足，我们就搬来代码作证。使用ILDasm反编译上面单件模式的Instance属性的代码，其中一段IL代码如下所示：

   1: IL_0007:stloc.1

   2: IL_0008:call void [mscorlib]System.Threading.Monitor::Enter(object)

   3: IL_000d:nop

   4: .try

   5: {

   6:     IL_000e:nop

   7:     IL_000f:ldsfld class Singleton Singleton::_instance

   8:     //….

   9:     //…

  10: }

  11: finally

  12: {

  13:     IL_002b:ldloc.1

  14:     IL_002c:call void [mscorlib]System.Threading.Monitor::Exit(object)

  15:     IL_0031:nop

  16:     IL_0032:endfinally

  17: }

为了简单，我省去了一部分代码。但是很明显，我们看到了System.Threading.Monitor.Enter和Exit。然后我们拿出Reflector看看这个Monitor到底是何方神圣。哎呀，发现Monitor.Enter和Monitor.Exit的代码如下所示：

   1: [MethodImpl(MethodImplOptions.InternalCall)]

   2: public static extern void Enter(objectobj);

   3: [MethodImpl(MethodImplOptions.InternalCall),ReliabilityContract(Consistency.WillNotCorruptState,Cer.Success)]

   4: public static extern void Exit(objectobj);

只见方法使用了extern关键字，方法上面还标有[MethodImpl(MethodImplOptions.InternalCall)]这样的特性，实际上这说明Enter和Exit的代码是在内部C++的代码实现的。只好拿出Rotor的代码求助了，对于所有"内部实现"的代码，我们可以在sscli20\clr\src\vm\ecall.cpp里找到映射：

   1: FCFuncStart(gMonitorFuncs)

   2: FCFuncElement("Enter", JIT_MonEnter)

   3: FCFuncElement("Exit", JIT_MonExit)

   4: …

   5: FCFuncEnd()

原来Enter映射到JIT_MonEnter，一步步的找过去，我们最终到了这里：

Sscli20\clr\src\vm\jithelpers.cpp：

   1: HCIMPL_MONHELPER(JIT_MonEnterWorker_Portable, Object* obj)

   2: {

   3:     //省略大部分代码

   4:     OBJECTREF objRef = ObjectToOBJECTREF(obj);

   5:     objRef->EnterObjMonitor();

   6: }

   7: HCIMPLEND

objRef就是object的引用，EnterObjMonitor方法的代码如下：

   1: void EnterObjMonitor()

   2: {

   3:     GetHeader()->EnterObjMonitor();

   4: }

GetHeader()方法获取对象头ObjHeader，在ObjHeader里有对EnterObjMonitor()方法的定义：

   1: void ObjHeader::EnterObjMonitor()

   2: {

   3:     GetSyncBlock()->EnterMonitor();

   4: }

GetSyncBlock()方法会获取该对象对应的SyncBlock，在SyncBlock里有EnterMonitor方法的定义：

   1: void EnterMonitor()

   2: {

   3:     m_Monitor.Enter();

   4: }

离核心越来越近了，m_Monitor是一个AwareLock类型的字段，看看AwareLock类内Enter方法的定义：

   1: void AwareLock::Enter()

   2: {

   3:     Thread* pCurThread = GetThread();

   4:     for (;;)

   5:     {

   6:          volatile LONG state = m_MonitorHeld;

   7:         if (state == 0)

   8:         {

   9:             // Common case: lock not held, no waiters. Attempt to acquire lock by

  10:              // switching lock bit.

  11:             if (FastInterlockCompareExchange((LONG*)&m_MonitorHeld, 1, 0) == 0)

  12:             {

  13:                 break;

  14:             }

  15:         }

  16:         else

  17:         {

  18:             // It's possible to get here with waiters but no lock held, but in this

  19:              // case a signal is about to be fired which will wake up a waiter. So

  20:              // for fairness sake we should wait too.

  21:              // Check first for recursive lock attempts on the same thread.

  22:              if (m_HoldingThread == pCurThread)

  23:              {

  24:                  goto Recursion;

  25:              }

  26:             // Attempt to increment this count of waiters then goto contention

  27:             // handling code.

  28:         if (FastInterlockCompareExchange((LONG*)&m_MonitorHeld, (state + 2), state) == state)

  29:         {

  30:              goto MustWait;

  31:         }

  32:     }

  33: }

  34:     // We get here if we successfully acquired the mutex.

  35:     m_HoldingThread = pCurThread;

  36:     m_Recursion = 1;

  37:     pCurThread->IncLockCount();

  38:     return;

  39: MustWait:

  40:      // Didn't manage to get the mutex, must wait.

  41:     EnterEpilog(pCurThread);

  42:      return;

  43:     Recursion:

  44:      // Got the mutex via recursive locking on the same thread.

  45:     m_Recursion++;

  46: }

从上面的代码我们可以看到，先使用GetThread()获取当前的线程，然后取出m_MonitorHeld字段，如果现在没有线程进入临界区，则设置该字段的状态，然后将m_HoldingThread设置为当前线程，从这一点上来这与Win32的过程应该是一样的。如果从m_MonitorHeld字段看，有线程已经进入临界区则分两种情况：第一，是否已进入的线程如当前线程是同一个线程，如果是，则把m_Recursion递加，如果不是，则通过EnterEpilog(pCurThread)方法，当前线程进入线程等待队列。

通过上面的文字描述和代码的跟踪，在我们的大脑中应该有这样一张图了：

总结

现在你应该知道lock背后发生的事情了吧。下一次面试的时候，当别人问你同步块索引的时候，你就可以滔滔不绝的和他论述一番。接下来还有两篇分析同步块的其他作用。

转自：https://www.cnblogs.com/yuyijq/archive/2009/03/13/1410071.html

posted @ 2019-10-04 23:07 老皮肉阅读(223) 评论(0) 收藏举报

刷新页面返回顶部

老肉

揭示同步块索引（上）：从lock开始

公告