.NET Core多线程 (4) 锁机制
合集:.NET Core多线程温故知新
- .NET Core多线程(1)Thread与Task
- .NET Core多线程(2)异步 - 上
- .NET Core多线程(3)异步 - 下
- .NET Core多线程(4)锁机制
- .NET Core多线程(5)常见性能问题
去年换工作时系统复习了一下.NET Core多线程相关专题,学习了一线码农老哥的《.NET 5多线程编程实战》课程,我将复习的知识进行了总结形成本专题。
本篇,我们来复习一下.NET中锁机制的相关知识点,预计阅读时间10分钟。
理解lock锁的底层原理
(1)为什么要用锁?
对某个共享代码区域(临界区)进行串行访问,使用lock来保证串行的安全。
(2)lock的用法
lock (lockMe) { dict.Add(i.ToString(), DateTime.Now); }
(3)lock的本质
通过ILSpy反编译查看可以知道,lock是个语法糖,编译后其实是Monitor.Enter 和 Monitor.Exit 的封装。
try { Monitor.Enter(lockMe, ref lockTake); dict.Add(i.ToString(), DateTime.Now); } finally { if (lockTake) { Monitor.Exit(lockMe); } }
(4)lock为何需要引用类型?
首先,编译器要求lock中的所对象必须是引用类型。
其次,因为lock会用到对象头中的同步块索引来进行同步,值类型没有堆中的数据。
无锁化:线程的本地存储
(1)线程本地存储
static 的作用域在AppDomain下都可见,此时在多线程环境中,通过static共享变量的方式来同步,不可避免会出现锁竞争。如果能将作用域范围缩小,比如缩小到Thread级别,就可以避免锁竞争。例如:ConcurrentBag就是一个好的例子。
(2).NET中的解决方案
ThreadStatic(Attribute):当前线程拿到的是定义好的值,其他线程拿到的可能是默认值(值类型可能是0,引用类型可能是null,需要注意容错)。
ThreadLocal:与ThreadStatic最大的区别在于ThreadStatic只在第一个线程初始化,ThreadLocal则会为每个线程初始化。
(3)存储在哪里?
- PEB 进程环境块
- TEB 线程环境块
- TLS 线程本地存储(Thread Local Storage),取决于一共有多少个DataSlot
(4)应用场景
用来做数据库连接池:DB连接池 基于 ThreadLocal实现,每个线程只能看见自己的请求队列;
用来做链式追踪:比如Skywalking或Zipkin等,用到ThreadLocal做本地存储,记录完整的调用链条如:A -> B -> C -> D;
内核态锁知多少
(1)基于WaitHandle的内核锁
这种锁是基于Windows底层的内核数据结构来维护线程之间的同步,比如:
-
AutoResetEvent / ManualResetEvent
-
Semaphore
-
Mutex
(2)优缺点
需要从用户态切换到内核态,相对来说比较重量级,相对耗费时间;内核模式的锁,不仅可用于创建线程同步,还可以创建进程同步。
用户态锁知多少
(1)用户态锁是啥?
例如下面的代码:
lock(obj) { ... // todo [1ms] }
大部分都是在临界区进行等待时间很短(比如1ms)的加锁,能不能让thread在CLR或C#层面内旋(自旋)一下,从而提高性能呢?使用用户态锁就可以避免上下文切换和内核切换带来的高开销。
(2)寻找解决方案
保持线程在用户态又要尽可能少的消耗CPU时间
时间片
- Windows中一个时间片大概是30ms
- Thread.Sleep(0)
- 提前结束自己的时间片,然后把自己放入到就绪队列中,如果就绪队列中的线程优先级 >= Current Thread,那么其他线程会被调度
- 如果就绪队列中的线程优先级 < Current Thread,那么Current Thread只能继续执行【低优先级线程得不到执行】
- 整体CPU级别
- Thread.Yield()
- 提前结束自己的时间片,如果当前逻辑CPU上的就绪队列上有待执行的线程,那么这个线程就会被调度(不考虑优先级)【低优先级线程可以得到执行】
- 逻辑CPU级别
极端休眠时间
- Sleep(1)
- 本质上和Sleep(1000)一样,都需要休眠
CAS原语
- read, operate, write => 打包成原子性
借助CLR内的AwareLock::SpinWait()
- C# SpinWait
- CLR SpinWait
(3).NET内置的SpinLock(用户态)
SpinLock在用法上和lock关键字差不多的。
class Program { public static SpinLock spinLock = new SpinLock(); public static int counter = 0; static void Main(string[] args) { Parallel.For(1, 1000001, (i) => { var lockTaken = false; spinLock.Enter(ref lockTaken); ++counter; spinLock.Exit(); } }); Console.WriteLine($"counter={counter}"); Console.ReadLine(); }
(4).NET CAS案例:Interlocked
CPU直接操作的,主要用在一些简单类型上:
-
read
-
operation
-
write
class Program { public static SpinLock spinLock = new SpinLock(); public static int counter = 0; static void Main(string[] args) { Parallel.For(1, 1000001, (i) => { Interlocked.Increment(ref counter, 1); }); Console.WriteLine($"counter={counter}"); Console.ReadLine(); }
混合态锁知多少
混合锁:用户态模式+内核态模式
(1)ManualResetEventSlim
它是如何实现的?
- lock
- ManualResetEvent
- CAS
- SpinWait(轻量级自旋锁)、SpinLock
(2)SemaphoreSlim
它是如何实现的?
- ManualResetEvent + lock + SpinWait
(3)ReaderWriterLockSlim
这个锁的内核版是 ReaderWriterLock,不带Slim就代表是内核态的锁。
这个锁顾名思义是读写锁,意思是:读可以并行,但写只能串行。EnterWriteLock() 需要等待所有的reader或writer锁结束,才能开始
(4)CountdownEvent
这个锁可以实现类似MapReduce的效果。
它是如何实现的?
基于ManualResetEvent事件做了底层封装。
线程安全集合知多少
(1)线程安全集合
.NET中都有哪些线程安全的集合类型?
ConcurrentBag 对应非线程安全类型:List
ConcurrentQueue 对应非线程安全类型:Queue
ConcurrentStack 对应非线程安全类型:Stack
ConcurrentDictionary 对应非线程安全类型:Dictionary
(2)BlockingCollection
BlockingCollection 意为 阻塞集合。
线程安全的集合 可以转换为 阻塞集合,只要它实现了IProducerConsumerCollection接口BlockingCollection可以实现类似发布订阅的业务场景应用:
-
生产端Add进去发布的消息
-
消费者端通过GetConsumingEnumerable()方法阻塞等待发布的消息
ConcurrentDictonary的两个大坑
(1)Values的坑
-
观察现象
-
业务场景:自己用ConcurrentDictionary封装了一个Cache
-
FullGC 将 LOH 上的对象回收了
-
所有>=85000byte的都会被纳入LOH
-
观察源码
-
Values方法每次都会生成一个新的List集合对象进行返回,每个对象都是大对象
-
如何改进
-
禁止调用Values方法
-
借助lock + Dictionary实现类似操作避免每次生成新的List集合对象
(2)GetOrAdd的坑
-
观察现象
-
业务场景:自己用ConcurrentDictionary封装了一个Redis连接池缓存
-
借助GetOrAdd实现的CreateInstance方法未能实现线程安全导致连接池被大量反复创建
-
观察源码
-
GetOrAdd方法中的valueFactory不是线程安全的
-
如何改进
-
借助Lazy改造字典的Value对象,保证创建方法只被执行一次,比如:将RedisConnection改为Lazy
共享变量在Release模式下的Bug
(1)现象
同样的代码,通过共享变量控制工作线程是否要结束自己,在Debug模式下没有问题,但是在Release模式下有问题。
(2)原因
JIT提供了错误的决策导致CPU在解析代码时做了优化,将 共享变量 存放在了CPU的寄存器中。
(3)WinDbg探究
-
Release模式
-
查看memory中的共享变量的值
-
CPU寄存器
-
查看共享变量的值
(4)解决方案
-
使用CancellationToken做取消
-
不用Cache,都读内存address中的对象,性能会相对较低
-
将共享变量 改为 易变结构,比如:private bool _shouldStop 改为 private volatile bool _shouldStop
小结
本篇,我们复习了锁机制相关的知识点。下一篇,我们将复习一下常见的.NET多线程相关的性能优化实践。
参考资料
一线码农,腾讯课堂《.NET 5多线程编程实战》
不明作者,《Task调度与await》