.NET线程同步技术解读
C#开发者(面试者)都会遇到lock(Monitor),Mutex,Semaphore,SemaphoreSlim这四个与锁相关的C#类型,本文期望以最简洁明了的方式阐述四种对象的区别。
1. 什么叫线程安全?
教条式理解
如果代码在多线程环境中运行的结果与 单线程运行结果一样,其他变量值也和预期是一样的,那么线程就是安全的;
线程不安全就是不提供数据访问保护,可能出现多个线程先后修改数据造成的结果是脏数据。
2. 发生场景
1. 线程抢占式执行(宏观上临界区片段代码肯定不是原子操作,执行可能会被打断),操作系统的线程调度是随机的, 这导致多线程环境下的【执行顺序存在不确定性】。
2. 多个线程修改同一变量(微观上操作又不是原子的), 就可能导致【数据不一致】或者竞争条件。
3. 内存可见性问题: 一个线程对共享变量的修改, 无法被其他线程看到,这是因为每个线程都有自己的工作堆栈,而工作堆栈的内容可能与内存中共享变量的副本, 【C#关键字volatile可用于解决内存可见性问题】。
2.1 线程同步: 宏观代码片段场景
两个线程都为集合增加元素,我们错误的理解即使是多线程也总有先后顺序吧,集合的两个位置先后塞进去就完了;实际上集合增加元素这个行为看起来简单,实际并不一定是原子操作。
在添加一个元素的时候,它可能会有两步来完成:
- 在 Items[Size] 的位置存放此元素;
- 增大 Size 的值。
-
在单线程运行的情况下,如果 Size = 0,添加一个元素后,此元素在位置0,之后设置Size=1;
-
如果是在多线程场景下,有两个线程,线程A先将元素存放在位置0,但是此时CPU调度线程A暂停,线程B得到运行机会;线程B也向此ArrayList添加元素,因为此时Size仍然等于0 (注意哦,我们假设添加元素是经过两个步骤,而线程A仅仅完成了步骤1),所以线程B也将元素存放在位置0。然后线程A和线程B都继续运行,都增加 Size 的值。 那好,我们来看看ArrayList的情况,元素实际上只有一个,存放在位置 0,而Size却等于2,形成了脏数据,这种就定义为对ArrayList的新增元素操作是线程不安全的。
线程安全这个问题不单单存在于集合类,我们始终要记得:
Never ever modify a shared resource by multipie threads unless resource is thread-safe.
-
我们对SqlServer,Mongodb,对HttpContext的访问都会涉及thread-safe, 利用C# mongodb driver操作Mongo打包时常用操作是线程安全的,Only a few of the C# Driver classes are thread safe. Among them: MongoServer, MongoDatabase, MongoCollection and MongoGridFS.
-
对于HttpContext 静态属性的操作是线程安全的: Any public static members of this type (HttpContext) are thread safe, any instance members are not guaranteed to be thread safe. 我们常用的是HttpContext.Current
各语言推出了适用于不同范围的线程同步技术来预防以上脏数据(实现线程安全)。
3. C#线程同步技术
话不多说, 给出大图:
四象限对象的区别:
该线程同步技术
- 支持线程进入的个数
- 是否跨进程支持
右半区是 跨进程线程同步的 几个系统内核对象,目前基本上不常用,可以忽略;
本次主要聊一聊左半区 (lock/monitor, semaphoreslim)CRL对象, 也就是语言级别实现的同步锁对象。
- 上半区 lock(Monitor)(支持单线程进入被保护代码,其他线程则必须等待进入的线程完成 {Critical Section}
- 下半区SemaphoreSlim(中文称为信号量)支持并发多线程进入被保护代码,对象在初始化时会指定 最大信号灯数量,当线程请求访问资源,信号量递减,而当他们释放时,信号量计数又递增。
① lock(Monitor)
开发者最常用的lock关键字,使用方式相当简单,对于单进程内线程同步相当有效,
lock实际上是Monitor的语法糖,实际的编译代码如下:
object __lockObj = x; bool __lockWasTaken = false; try { System.Threading.Monitor.Enter(__lockObj, ref __lockWasTaken); // Your code... } finally { if (__lockWasTaken) System.Threading.Monitor.Exit(__lockObj); }
一般使用私有静态对象作为lock(Monitor)线程同步的同步对象,那配合lock完成代码锁定的那个对象到底起什么作用呢?
这里面有个SyncBlockIndex的概念,CLR对象
新建的托管堆在内存表现如下:
每个堆对象: 函数表指针(这也是一个重要知识点,用于在多态中判断对象到底是哪个类型)、同步块索引、对象字段;
其中同步块索引SyncBlockIndex是lock解决线程同步的关键,SyncBlockIndex是一个地址指针(传送门);
新创建的对象objLock, 其SyncBlockindex =-1, 不指向任何有效同步块;
调用静态类Monitor.Enter(objLock), CRL会寻找一个空闲SyncBlock并将objLock对象的SyncBlockIndex指向该块, 例如上图中ObjectA,ObjectC的SyncBlockIndex指向了2个SyncBlock;
Exit(objLock)会将objLock对象的SyncBlockIndex重新赋为 -1, 释放出来的SyncBlock可以在将来被其他对象SyncBlockIndex引用。
② lock(Monitor) vs SemaphoreSlim
两者都是进程内线程同步技术,SemaphoreSlim信号量支持多线程进入;
另外SemaphoreSlim 有异步等待方法,支持在异步代码中线程同步, 能解决在async code中无法使用lock语法糖的问题;
// 实例化单信号量 static SemaphoreSlim semaphoreSlim = new SemaphoreSlim(1,1); // 异步等待进入信号量,如果没有线程被授予对信号量的访问权限,则进入执行保护代码;否则此线程将在此处等待,直到信号量被释放为止 await semaphoreSlim.WaitAsync(); try { await Task.Delay(1000); } finally { // 任务准备就绪后,释放信号灯。【准备就绪时始终释放信号量】至关重要,否则我们将获得永远被锁定的信号量
// 这就是为什么在try ... finally子句中进行发布很重要的原因;程序执行可能会崩溃或采用其他路径,这样可以保证执行 semaphoreSlim.Release(); }
4. 原子操作
不同于以上提供的线程安全技术: 是作用在临界代码段的外侧;
计算机还有一种**利用硬件为多个线程共享的变量提供原子操作** 的技术,C# 是interLocked类, golang sync/atomic 包。
- 数学运算Add public static int Add (ref int location1, int value);
- 位运算 public static int And (ref int location1, int value);
- CAS比较运算:
public static UIntPtr CompareExchange (ref UIntPtr location1, UIntPtr value, UIntPtr comparand);
参数1, 是待比较变量; 参数3是与参数1做比较的值 ,如果相等则替换为参数2; 返回值是参数1原始值
- 自增、自减
-
将变量设置为指定值,并返回原始值 作为原子操作
public static uint Exchange (ref uint location1, uint value); - 32位机器读取64位值: public static long Read (ref long location);
The Read method is unnecessary on 64-bit systems, because 64-bit read operations are already atomic. On 32-bit systems, 64-bit read operations are not atomic unless performed using Read.
着重理解一下 CompareExchange又叫CAS,这是一种乐观锁的思想。
do { // Save the current running total in a local variable. initialValue = totalValue; // Add the new value to the running total. computedValue = initialValue + addend; // CompareExchange compares totalValue to initialValue. If // they are not equal, then another thread has updated the // running total since this loop started. CompareExchange // does not update totalValue. CompareExchange returns the // contents of totalValue, which do not equal initialValue, // so the loop executes again. } while (initialValue != Interlocked.CompareExchange(ref totalValue, computedValue, initialValue)); // 虽然返回值不是bool值, 通过返回值(原始值)与比较值的比较来判断 原始比较。 // If no other thread updated the running total, then // totalValue and initialValue are equal when CompareExchange // compares them, and computedValue is stored in totalValue. // CompareExchange returns the value that was in totalValue // before the update, which is equal to initialValue, so the // loop ends. // The function returns computedValue, not totalValue, because // totalValue could be changed by another thread between // the time the loop ends and the function returns. return computedValue;
原子操作是一种无锁技术, 由硬件保证,由cpu指令完成。
https://learn.microsoft.com/en-us/dotnet/api/system.threading.interlocked.compareexchange?view=net-8.0
总结
从宏观上掌握 Monitor,Mutex, SemaphoreSlim,Semaphore的区别有利于形成【线程同步知识体系】;
文章着重记录 进程内线程同步技术, 同时我们也要理解内核态线程同步的两大法宝 Mutex Semaphore的基本原理。
本文来自博客园,作者:{有态度的马甲},转载请注明原文链接:https://www.cnblogs.com/JulianHuang/p/11765397.html
欢迎关注我的原创技术、职场公众号, 加好友谈天说地,一起进化