C#多线程（三）线程高级篇

前言

抛开死锁不谈，只聊性能问题，尽管锁总能粗暴的满足同步需求，但一旦存在竞争关系，意味着一定会有线程被阻塞，竞争越激烈，被阻塞的线程越多，上下文切换次数越多，调度成本越大，显然在高并发的场景下会损害性能。在高并发高性能且要求线程安全的述求下，无锁构造（非阻塞构造）闪亮登场。

如果你对同步&阻塞不是很清晰，请跳转到上一篇：同步基础传送门

参考文档：

C# - 理论与实践中的 C# 内存模型

volatile 关键字

一、非阻塞同步

重排序与缓存

我们观察下面这个例子：

public class Foo
{
    private int _answer;
    private bool _complete;

    void A() //A 1
    {
        _answer = 10;
        _complete = true;
    }

    void B() //B 2
    {
        if (_complete) Console.WriteLine(_answer);
    }
}

如果方法A和B在不同的线程上并发运行，B可能会打印 “ 0 “ 吗？答案是会的，原因如下：

编译器、CLR 或 CPU 可能会对代码/指令进行重排序（reorder）以提高效率。
编译器、CLR 或 CPU 可能会进行缓存优化，导致其它线程不能马上看到变量的新值。

请务必重视它们，它们将是幽灵般的存在

int x = 0, y = 0, a = 0, b = 0;

var task1 = Task.Run(() => // A 1
{
    a = 1; // 1
    x = b; // 2
});
var task2 = Task.Run(() => // B 2
{
    b = 2; // 3
    y = a; // 4
});
Task.WaitAll(task1, task2);
Console.WriteLine("x:" + x + " y:" + y);

直觉和经验告诉我们，程序至顶向下执行：代码1一定发生在代码2之前，代码3一定发生在代码4之前，然鹅

在一个独立的线程中，每一个语句的执行顺序是可以被保证的，但在不使用lock，waithandle这样的显式同步操作时，我们就没法保证事件在不同的线程中看到的执行顺序是一致的了。尽管线程A中一定需要观察到a=1执行成功之后才会去执行x=b，但它没法确保自己观察得到线程B中对b的写入，所以A还可能会打印出y的一个旧版的值。这就叫指令重排序。

x:0 y:1 #1-2-3-4
x:2 y:0 #3-4-1-2
x:2 y:1 #1-3-2-4

可实际运行时还是有些让我们惊讶的情况：

x:0 y:0 #??

这就是缓存问题，如果两个线程在不同的CPU上执行，每一个核心有自己的缓存，这样一个线程的写入对于其它线程，在主存同步之前就是不可见的了。

C#编译器和CLR运行时会非常小心的保证上述优化不会破坏普通的单线程代码，和正确使用锁的多线程代码。但有时，你仍然需要通过显示的创建内存屏障（memory barrier，也称作内存栅栏（memory fence））来对抗这些优化，限制指令重排序和读写缓存产生的影响。

内存屏障

参考博客小林野夫

处理器支持哪种内存重排序（LoadLoad重排序、LoadStore重排序、StoreStore重排序、StoreLoad重排序），就会提供相对应能够禁止重排序的指令，而这些指令就被称之为内存屏障（LoadLoad屏障、LoadStore屏障、StoreStore屏障、StoreLoad屏障）

屏障名称	示例	具体作用
StoreLoad	Store1;Store2;Store3;StoreLoad;Load1;Load2;Load3	禁止StoreLoad重排序，确保屏障之前任何一个写（如Store2）的结果都会在屏障后任意一个读操作（如Load1）加载之前被写入
StoreStore	Store1;Store2;Store3;StoreStore;Store4;Store5;Store6	禁止StoreStore重排序，确保屏障之前任何一个写（如Store1）的结果都会在屏障后任意一个写操作（如Store4）之前被写入
LoadLoad	Load1;Load2;Load3;LoadLoad;Load4;Load5;Load6	禁止LoadLoad重排序，确保屏障之前任何一个读（如Load1）的数据都会在屏障后任意一个读操作（如Load4）之前被加载
LoadStore	Load1;Load2;Load3;LoadStore;Store1;Store2;Store3	禁止LoadStore重排序，确保屏障之前任何一个读（如Load1）的数据都会在屏障后任意一个写操作（如Store1）的结果被写入高速缓存（或主内存）前被加载

读屏障告诉处理器在执行任何的加载前，执行所有已经在失效队列（Invalidte Queues）中的失效（I）指令。即：所有load barrier之前的store指令对之后（本核心和其他核心）的指令都是可见的。

Store Memory Barrier：写屏障，等同于前文的StoreStore Barriers 将store buffer都写入缓存。

写屏障告诉处理器在执行这之后的指令之前，执行所有已经在存储缓存（store buffer）中的修改（M）指令。即：所有store barrier之前的修改（M）指令都是对之后的指令可见。

最简单的内存屏障是完全内存屏障（full memory barrier，或全栅栏（full fence）），它可以阻止所有跨越栅栏的指令进行重排并提交修改和刷新缓存。内存屏障之前的所有写操作都要写入内存，并将内存中的新值刷到缓存，使得其它CPU核心能够读取到最新值，完全保证了数据的强一致性，进而解决CPU缓存带来的可见性问题。

我们简单修改一下前面的案例

void A()
{
    _answer = 10;
    Thread.MemoryBarrier(); // 1
    _complete = true;
    Thread.MemoryBarrier(); // 3
}
void B()
{
    Thread.MemoryBarrier(); // 2
    if (_complete)
    {
        _testOutputHelper.WriteLine(_answer.ToString());
    }
}

屏障1,3使得这个例子不可能打印出0，屏障2保证如果B在A之后执行，_complete一定读到的是true

内存屏障离我们并不遥远，以下方式都会隐式的使用全栅栏：

lock语法糖或Monitor.Enter / Monitor.Exit
Interlocked类中的所有方法
使用线程池的异步回调，包括异步委托，APM回调，以及任务延续（task continuations）
信号构造的等待/复位
任何依赖信号同步的情况，比如启动或等待Task，因此下面的代码也是线程安全的
```
int x = 0;
Task t = Task.Factory.StartNew (() => x++);
t.Wait();
Console.WriteLine (x);    // 1
```

volatile

另一个（更高级的）解决这个问题的方法是对_complete字段使用volatile关键字。

volatile bool _complete;

volatile关键字通知编译器在每个读这个字段的地方使用一个读栅栏（acquire-fence），并且在每个写这个字段的地方使用一个写栅栏（release-fence）。

这种“半栅栏（half-fences）”比全栅栏更快，因为它给了运行时和硬件更大的优化空间。

读栅栏：也就是读屏障（Store Memory Barrier），等同于前文的LoadLoad Barriers 将Invalidate的都执行完成。告诉处理器在执行任何的加载前，执行所有已经在失效队列（Invalidte Queues）中的失效（I）指令。即：所有load barrier之前的store指令对之后（本核心和其他核心）的指令都是可见的。

写栅栏：也就是写屏障（Store Memory Barrier），等同于前文的StoreStore Barriers 将store buffer都写入主存。
告诉处理器在执行这之后的指令之前，执行所有已经在存储缓存（store buffer）中的修改（M）指令。即：所有store barrier之前的修改（M）指令都是对之后的指令可见。

巧的是，Intel 的 X86 和 X64 处理器总是在读时使用读栅栏，写时使用写栅栏，无论是否使用volatile关键字。所以在使用这些处理器的情况下，这个关键字对硬件来说是无效的。然而，volatile关键字对编译器和 CLR 进行的优化是有作用的，以及在 64 位 AMD 和 Itanium 处理器上也是有作用的。这意味着不能因为你的客户端运行在特定类型的 CPU 上而放松警惕。

注意：使用volatile不能阻止写-读被交换

第一条指令	第二条指令	是否会被交换
读	读	不会
读	写	不会
写	写	不会（CLR 确保写-写操作永远不会被交换，就算是没有`volatile`关键字）
写	读	会！

在下面案例中仍然有可能会打印00的情况（对a的读取可能发生在写入前--重排序）

int a = 0, b = 0;
int x = 0, y = 0;
var task1 = Task.Run(() =>
{
    Thread.VolatileWrite(ref a, 1);
    x = Thread.VolatileRead(ref b);
});
var task2 = Task.Run(() =>
{
    Thread.VolatileWrite(ref b, 2);
    y = Thread.VolatileRead(ref a);
});
Task.WaitAll(task1, task2);

Console.WriteLine("x:" + x + " y:" + y);

volatile关键字不能应用于数组元素，不能用在捕获的局部变量：这些情况下你必须使用VolatileRead和VolatileWrite方法

从上面的例子我们可以看出，写-读操作可能被重新排序，官方的解释是：

在多处理器系统上，易失性读取操作不保证获取由任何处理器写入该内存位置的最新值。同样，易失性写入操作不保证写入的值会立即对其他处理器可见。

（我的理解是：volatile关键字只能解决重排序问题，解决不了多处理器的缓存一致性问题）

注意double 和 long无法标记为 volatile，因为对这些类型的字段的读取和写入不能保证是原子的。若要保护对这些类型字段的多线程访问，请使用 Interlocked 类成员或使用 lock 语句保护访问权限。

Interlocked

位于System.Threading，为多个线程共享的变量提供原子操作，这也是DOTNET为数不多的线程安全类型之一。

Interlocked通过将原子性的需求传达给操作系统和CLR来进行实现其功能，此类的成员不会引发异常。

可以防止 1.线程上下文切换，2.线程更新可由其他线程访问的变量时，或者当两个线程同时在不同的处理器上执行时可能会出现的错误。

场景：

int i = 0;
i ++;

在大多数计算机上，自增并不是原子操作，需要以下步骤：

将变量i的值加载到寄存器中。
计算i + 1。
将上面的计算结果存储在变量i中。

假设A线程执行完1-2时被抢占，B线程执行1-2-3，当A线程恢复时继续执行3，此时B线程的值就被覆盖掉了。

使用Increment即可解决，123会被打包成一个操作，以原子的方式实现自增

CAS

定义(摘自百度百科)：

CAS 操作包含三个操作数 —— 内存位置（V）、预期原值（A）和新值(B)。如果内存位置的值与预期原值相匹配，那么处理器会自动将该位置值更新为新值。否则，处理器不做任何操作。无论哪种情况，它都会在 CAS 指令之前返回该位置的值。（在 CAS 的一些特殊情况下将仅返回 CAS 是否成功，而不提取当前值。）CAS 有效地说明了“我认为位置 V 应该包含值 A；如果包含该值，则将 B 放到这个位置；否则，不要更改该位置，只告诉我这个位置的值即可。”

Interlocked.CompareExchange，实现了CAS：比较两个值是否相等，如果相等，则替换第一个值，否则什么都不做，最终返回这个位置的原始值。

Interlocked.CompareExchange(ref _num, 1000, 500);

CAS在保证原子性读写的同时，没有加锁，保障了程序并发度，但也存在缺陷：

ABA问题
只能保证一个地址的读写原子性
自旋CAS时间过长，容易给CPU带来大开销

二、延迟初始化

面试时候经常问：单例模式中的懒汉模式线程安全问题

场景：某个字段构造开销非常大，使得在初始化A时需要承担初始化Expensive的开销，即使Expensive字段不会被用到。

public class A
{
    public readonly Expensive Expensive = new Expensive();
    // ..
}

public class Expensive
{
    // 构造开销非常昂贵
}

自然会想到懒汉模式：按需加载

public class B
{
    private Expensive _expensive;

    public Expensive GetExpensiveInstance()
    {
        if (_expensive == null) _expensive = new Expensive();

        return _expensive;
    }
}

新的问题产生：GetExpensiveInstance是线程安全的吗？我们可以通过加锁解决

public class C
{
    private readonly object _locker = new object();
    private Expensive _expensive;

    public Expensive GetExpensiveInstance()
    {
        lock (_locker)
        {
            if (_expensive == null) _expensive = new Expensive();
            return _expensive;
        }
    }
}

现在面试官继续问：还有性能更好的版本吗？..

Lazy

net standard1.0 提供System.Lazy<T>来帮助你以线程安全且高效的方式（DCL）解决延迟初始化问题，只需

public class D
{
    private Lazy<Expensive> _expensive = new Lazy<Expensive>(() => new Expensive(), true);

    public Expensive GetExpensiveInstance() => _expensive.Value;
}

第一个参数是一个委托，告知如何构建，第二个参数是boolean类型，传false实现的就是上面提到的plain B非线程安全迟初始化

双检锁 double checked locking会进行一次额外的易失读（volatile read），在对象已经完成初始化时，能够避免获取锁产生的开销。

public class E
{
    private readonly object _locker = new object();
    private volatile Expensive _expensive;

    public Expensive GetExpensiveInstance()
    {
        // 额外的易失读（volatile read）
        if (_expensive == null)
        {
            lock (_locker)
            {
                if (_expensive == null) _expensive = new Expensive();
            }
        }
        
        return _expensive;
    }
}

LazyInitializer

LazyInitializer是一个静态类，提供EnsureInitialized方法，第一个参数是需要构造的变量地址，第二个参数是一个委托，告知如何构造

public class F
{
    private Expensive _expensive;

    public Expensive GetExpensiveInstance()
    {
        LazyInitializer.EnsureInitialized(ref _expensive,
            () => new Expensive());
        return _expensive;
    }
}

它使用竞争初始化模式的实现，比双检锁更快（在多核心情况下），因为它的实现完全不使用锁。这是一个很少需要用到的极端优化，并且会带来以下代价：

当参与初始化的线程数大于核心数时，它会更慢。
可能会因为进行了多余的初始化而浪费 CPU 资源。
初始化逻辑必须是线程安全的（例如，Expensive的构造器对静态字段进行写，就不是线程安全的）。
如果初始化的对象是需要进行销毁的，多余的对象需要额外的逻辑才能被销毁。

竞争初始化（race-to-initialize）模式，通过易失性和CAS，实现无锁构造

public class G
{
    private volatile Expensive _expensive;
    public Expensive Expensive
    {
        get
        {
            if (_expensive == null)
            {
                var instance = new Expensive();
                Interlocked.CompareExchange (ref _expensive, instance, null);
            }
            return _expensive;
        }
    }
}

三、线程局部存储

我们花费了大量篇幅来讲并发访问公共数据问题，前文提到的锁构造，信号构造，无锁构造本质上都是使用同步构造，使得多线程在访问公共数据时能安全的进行，然而有时我们会希望数据在线程间是隔离的，局部变量就能实现这个目的，但他们的生命周期总是那么短暂（随代码块而释放），我们期待更大作用域的隔离数据，线程局部变量（thread-local storage，TLS）就可以实现这个目的。

ThreadStatic

被ThreadStatic标记的static字段不会在线程间共享，每个执行线程都有一个单独的字段实例

Note：

被标记的必须是static字段，不能在实例字段上使用（添加了也无效）
请不要给被标记的字段指定初始值，因为这种初始化只会在类被构造时执行一次，影响一个线程，因此他依赖零值

如果你需要使用实例字段，或者非零值，请使用ThreadLocal<T>

public class ThreadStatic测试
{
    private readonly ITestOutputHelper _testOutputHelper;
    [ThreadStatic] private static int _num;

    public ThreadStatic测试(ITestOutputHelper testOutputHelper)
    {
        _testOutputHelper = testOutputHelper;
    }

    [Fact]
    void Show()
    {
        void Work()
        {
            for (int i = 0; i < 100000; i++)
            {
                _num++;
                _testOutputHelper.WriteLine(_num.ToString());
            }
        }

        var t1 = new Thread(Work);
        var t2 = new Thread(Work);

        t1.Start();
        t2.Start();
        t1.Join();
        t2.Join();

        _testOutputHelper.WriteLine(_num.ToString());
    }
}

输出：

100000
100000
0

LocalDataStoreSlot

封装内存槽以存储本地数据。此类不能被继承。.NET Framework 1.1加入，但在standard2.0+才有。

public sealed class LocalDataStoreSlot

.NET Framework 提供了两种机制，用于使用线程本地存储 (TLS) ：LocalDataStoreSlot和ThreadStaticAttribute

LocalDataStoreSlot比ThreadStaticAttribute更慢，更尴尬。此外，数据存储为类型 Object，因此必须先将其强制转换为正确的类型，然后再使用它。

有关使用 TLS 的详细信息，请参阅线程本地存储。

同样，.NET Framework 提供了两种使用上下文本地存储的机制：LocalDataStoreSlot和ContextStaticAttribute。上下文相对静态字段是用属性标记的 ContextStaticAttribute 静态字段。请参考注解

// 同一个 LocalDataStoreSlot 对象可以跨线程使用。
LocalDataStoreSlot _slot = Thread.AllocateNamedDataSlot("mySlot");
void Work()
{
    for (int i = 0; i < 100000; i++)
    {
        int num = (int)(Thread.GetData(_slot)??0);
        Thread.SetData(_slot, num + 1);
    }
    _testOutputHelper.WriteLine(((int)(Thread.GetData(_slot)??0)).ToString());
}
var t1 = new Thread(Work);
var t2 = new Thread(Work);
t1.Start();
t2.Start();
t1.Join();
t2.Join();
_testOutputHelper.WriteLine(((int)(Thread.GetData(_slot)??0)).ToString());

输出效果和ThreadStaticAttribute一样：

100000
100000
0

使用Thread.FreeNamedDataSlot("mySlot");可以释放所有线程上的指定槽，但是只有在所有对该槽的引用都出了其作用域，并且被垃圾回收后才会真正释放。这确保了只要保持对槽的引用，就能继续使用槽。

你也可以通过Thread.AllocateDataSlot()来创建一个无名槽位，与命名槽的区别是无名槽需要自行控制作用域

当然我们也可以对上面复杂的᠍᠍᠍᠍᠍Thread.GetData,Thread.SetData进行封装

LocalDataStoreSlot _secSlot = Thread.GetNamedDataSlot ("securityLevel");
int Num
{
    get
    {
        object data = Thread.GetData(_secSlot);
        return data == null ? 0 : (int) data;    // null 相当于未初始化。
    }
    set { Thread.SetData (_secSlot, value); }
}

ThreadLocal

ThreadLocal<T>是 Framework 4.0 加入的，涵盖在netstandard1.0。它提供了可用于静态字段和实例字段的线程局部存储，并且允许设置默认值。

public class ThreadLocal测试
{
    ThreadLocal<int> _num = new ThreadLocal<int> (() => 3);
    private readonly ITestOutputHelper _testOutputHelper;


    public ThreadLocal测试(ITestOutputHelper testOutputHelper)
    {
        _testOutputHelper = testOutputHelper;
    }

    [Fact]
    void Show()
    {
        void Work()
        {
            for (int i = 0; i < 100000; i++)
            {
                _num.Value++;
            }
            _testOutputHelper.WriteLine(_num.ToString());
        }

        var t1 = new Thread(Work);
        var t2 = new Thread(Work);

        t1.Start();
        t2.Start();
        t1.Join();
        t2.Join();

        _testOutputHelper.WriteLine(_num.ToString());
    }
}

输出

100003
100003
3

下面这个测试非常有意思

[Fact]
void Show()
{
    var threadName = new ThreadLocal<string>(() => "Thread" + Thread.CurrentThread.ManagedThreadId);
    Parallel.For(0, 13, x =>
    {
        bool repeat = threadName.IsValueCreated;
        _testOutputHelper.WriteLine($"ThreadName = {threadName.Value} {(repeat ? "(repeat)" : "")}");
    });
    
    threadName.Dispose();  // 释放资源
}

你会发现当Parallel.For第二个参数超过你的逻辑内核后，repeat出现了！

ThreadName = Thread5 
ThreadName = Thread8 
ThreadName = Thread31 
ThreadName = Thread29 
ThreadName = Thread31 (repeat)
ThreadName = Thread30 
ThreadName = Thread18 
ThreadName = Thread12 
ThreadName = Thread32 
ThreadName = Thread28 
ThreadName = Thread33 
ThreadName = Thread35 
ThreadName = Thread34

Random类不是线程安全的，所以我们要不然在使用Random时加锁（这样限制了并发），如今我们有了ThreadLocal：

var localRandom = new ThreadLocal<Random>(() => new Random());

很轻易的就解决了线程安全问题，但是上面的版本使用的Random的无参构造方法，会依赖系统时间作为生成随机数的种子，在大概 10ms 时间内创建的两个Random对象可能会使用相同的种子，下边是解决这个问题的一个办法：

var localRandom = new ThreadLocal<Random>(() => new Random (Guid.NewGuid().GetHashCode()) );

特别注意，不要以为GUID全局唯一，GUID的HashCode也全局唯一，上面的随机数仍然不是真随机

AsyncLocal

MSDN：表示给定异步控制流（如异步方法）的本地环境数据。

说人话就是：类似ThreadLocal，但是ThreadLocal不支持await导致线程切换，而AsyncLocal支持

由于基于Task的异步编程模型倾向于抽象线程的使用，因此可以使用AsyncLocal<T>实例跨线程持久化数据。

public sealed class AsyncLocal<T>

当与当前线程关联的值发生更改时会调用valueChangedHandler

public AsyncLocal(Action<AsyncLocalValueChangedArgs<T>>? valueChangedHandler)

对比ThreadLocal

AsyncLocal<int> _num = new AsyncLocal<int>();
ThreadLocal<int> _num2 = new ThreadLocal<int>();
async Task Work()
{
    for (int i = 0; i < 100000; i++)
    {
        _num.Value++;
        _num2.Value++;
    }
    _testOutputHelper.WriteLine(_num.Value.ToString());
    _testOutputHelper.WriteLine(_num2.Value.ToString());
    await Task.Delay(100);
    for (int i = 0; i < 100000; i++)
    {
        _num.Value++;
        _num2.Value++;
    }
    _testOutputHelper.WriteLine(_num.Value.ToString());
    _testOutputHelper.WriteLine(_num2.Value.ToString());
}
await Work();

输出：

四、Monitor之信号构造

回顾一下信号构造

信号构造的本质：一个线程阻塞直到收到另一个线程发来的通知。

在同步基础中我们已经讲过了dotnet常见的信号构造api，今天，让我们再次看看Monitor，它是如何完成信号构造的。

Wait和Pulse几乎是万能的，通过一个bool标识我们就能实现AutoResetEvent/ManualResetEvent的功能，同理使用一个整形字段，就可以实现CountdownEvent/Semaphore，几乎任何信号构造api无法满足的功能，都能由Monitor完成，Monitor是信号构造的终极，如果你的功力足够，它可以是整个阻塞构造的终极

Wait和Pulse

当多线程Wait同一对象时，就形成了一个“等待队列（waiting queue）”，和用于等待获得锁的“就绪队列（ready queue）”不同，每次调用Pulse时会释放队头线程，它会进入就绪队列，然后重新获取锁。可以把它想象成一个自动停车场，首先你在收费站（等待队列）排队验票，然后在栅栏前（就绪队列）排队等待放行。

这个队列结构天然有序，但是，对于Wait/Pulse应用通常不重要，在这种场景下把它想象成一个等待线程的“池（pool）”更好理解，每次调用Pulse都会从池中释放一个等待线程。

PulseAll释放整个等待队列或者说等待池。收到Pulse的线程不会完全同时开始执行，而是有序的执行，因为每个Wait语句都要试图重新获取同一把锁。他们的效果就是，PulseAll将线程从等待队列移到就绪队列中，让它们可以继续有序执行。

定义一个字段，作为同步对象

private readonly object _locker = new object();

定义一个或多个字段，作为阻塞条件
```
private bool _ok;
```
当你希望阻塞的时候

Monitor.Wait在等待脉冲时，同步对象上的锁会被释放，并且进入阻塞状态，直到收到 _locker上的脉冲，收到脉冲后重新获取 _locker，如果此时 _locker 已经被别的线程占有，则继续阻塞，直至_获取 _locker
```
lock (_locker) 
{
    while (!_ok)
    {
        Monitor.Wait (_locker);
    }
}
```

当你希望改变阻塞条件时

lock (_locker)
{
    _ok = true;
    Monitor.Pulse(_locker);  // Monitor.PulseAll(_locker);
}

使用Wait/Pulse需要注意：

Wait / Pulse不能lock块之外使用，否则会抛异常。
Pulse最多释放一个线程，而PulseAll释放所有线程。
Wait会立即释放当前持有的锁，然后进入阻塞，等待脉冲
收到脉冲会立即尝试重新获取锁，如果在指定时间内重新获取，则返回true，如果在超过指定时间获取，则返回false，如果没有获取锁，则一直阻塞不会返回

性能方面，调用Pulse花费大概约是在等待句柄上调用Set三分之一的时间。但是，使用Wait和Pulse进行信号同步，对比事件等待句柄有以下缺点：

Wait / Pulse不能跨越应用程序域和进程使用。
必须通过锁保护所有信号同步逻辑涉及的变量。

等待超时

调用Wait方法时，你可以设定一个超时时间，可以是毫秒或TimeSpan的形式。如果因为超时而放弃了等待，那么Wait方法就会返回false。

public static bool Wait(object obj, TimeSpan timeout)

如果在超时到达时仍然没有获得一个脉冲，CLR会主动给它发送一个虚拟的脉冲（virtual pulse），使其能够重新获得锁，然后继续执行，就像收到一个真实脉冲一样。

下面这个例子非常有用，它可以定期的检查阻塞条件。即使其它线程无法按照预期发送脉冲，例如程序之后被其他人修改，但没能正确使用Pulse，这样也可以在一定程度上免疫 bug。因此在复杂的同步设计中可以给所有Wait指定超时时间。

lock (_locker)
  while (/* <blocking-condition> */)
    Monitor.Wait (_locker, /* <timeout> */);

Monitor.Wait的boolean类型返回值其实还可以这么理解：其返回值意味着是否获得了一个“真实的脉冲“。

如果”虚拟的脉冲“并不是期待的行为，可以记录日志或抛出异常。

Wait等待一个变量上的脉冲，Pulse对一个变量发送脉冲。脉冲也是一种信号形式，相对于事件等待句柄那种锁存（latching）信号，脉冲顾名思义是一种非锁存或者说易失的信号

双向信号与竞争状态

Monitor.Pulse是一种单向通信机制：发送脉冲的线程不关心发出的脉冲被谁收到了，他没有返回值，不会阻塞，内部也没有确认机制。

当一个线程发起一次脉冲：

如果等待队列中没有任何线程，那么这次发起的脉冲不会有任何效果。
如果等待队列中有线程，线程发送完脉冲并释放锁后，并不能保证接到脉冲信号的等待线程能立即开始工作。

然后我们有一些场景依赖等待线程能够在收到脉冲后及时的响应，此时，双向信号出现了，这是一种自定义的确认机制。

在上文的信号构造基础上改造一个竞争状态的案例：

public class 竞争状态测试
{
    private readonly ITestOutputHelper _testOutputHelper;
    private readonly object _locker = new object();
    private bool _ok;

    public 竞争状态测试(ITestOutputHelper testOutputHelper)
    {
        _testOutputHelper = testOutputHelper;
    }

    [Fact]
    void Show()
    {
        new Thread(() =>  // Worker
        {
            for (int i = 0; i < 5; i++)
                lock (_locker)
                {
                    while (!_ok) Monitor.Wait(_locker);
                    _ok = false;
                    _testOutputHelper.WriteLine("Wassup?");
                }
        }).Start();

        for (int i = 0; i < 5; i++)
        {
            lock (_locker)
            {
                _ok = true;
                Monitor.Pulse(_locker);
            }
        }
    }
}

我们期待的结果：

Wassup?
Wassup?
Wassup?
Wassup?
Wassup?

实际上这个这个程序可能一次”Wassup?“都不会输出：主线程可能在工作线程启动之前完成，这五次Pulse啥事都没干

还记得我们讲事件等待句柄时，使用AutoResetEvent来模拟的双向信号吗？现在使用Monitor来实现一个扩展性更好的版本

public class 双向信号测试
{
    private readonly ITestOutputHelper _testOutputHelper;
    private readonly object _locker = new();
    private bool _entry; // 我是否可以工作了
    private bool _ready; // 我是否可以继续投递了

    public 双向信号测试(ITestOutputHelper testOutputHelper)
    {
        _testOutputHelper = testOutputHelper;
    }

    [Fact]
    void Show()
    {
        new Thread(() =>
        {
            Thread.Sleep(100);
            for (int i = 0; i < 5; i++)
            {
                lock (_locker)
                {
                    _ready = true;
                    Monitor.PulseAll(_locker);
                    while (!_entry) Monitor.Wait(_locker);
                    _entry = false;
                    _testOutputHelper.WriteLine("Wassup?");
                }
            }
        }).Start();

        for (int i = 0; i < 5; i++)
        {
            lock (_locker)
            {
                while (!_ready) Monitor.Wait(_locker);
                _ready = false;
                _entry = true;
                Monitor.PulseAll(_locker);
            }
        }
    }
}

我们仍然使用_ready来作为上游脉冲线程的自旋条件，使用_entry作为下游等待线程的自旋条件。由于我们的逻辑都在lock语句中，即使之后引入了第三个线程，我们的逻辑仍然不会出问题，_ready和_entry的读写总是原子的。

升级生产消费队列

这次，我们将允许多个消费者，各自拥有独立的消费线程。使用一个数组来存放这些线程，并且他们接收的不再是string，而是更加灵活的委托：
```
private Thread[] _workers;
private Queue<Action> _queue = new Queue<Action>();
```
和上次一样，我们传递null来告知消费者线程退出：
```
foreach (var worker in _workers)
{
    AddTask(null);
}
```
在告知消费线程退出后Join这些线程，等待未完成的任务被消费：
```
foreach (var worker in _workers)
{ 
    worker.Join();
}
```

每个工作线程会执行一个名为Consume的方法。我们在构造队列时循环创建和启动这些线程：

_workers = new Thread[workerCount];
for (int i = 0; i < workerCount; i++)
{
    _workers[i] = new Thread(Consume);
    _workers[i].Start();
}

消费Comsume方法，一个工作线程从队列中取出并执行一个项目。我们希望工作线程没什么事情做的时候，或者说当队列中没有任何项目时，它们应该被阻塞。因此，我们的阻塞条件是_queue.Count == 0：

private void Consume()
{
    while (true)
    {
        Action task;
        lock (_locker)
        {
            while (_queue.Count == 0)
            {
                Monitor.Wait(_locker);  // 队列里没任务，释放锁，进入等待
            }
            // 获取新任务，重新持有锁
            task = _queue.Dequeue();
        }
        
        if (task == null) return;  // 空任务代表退出
        task();  // 执行任务
    }
}

添加一个任务。出于效率考虑，加入一个任务时，我们调用Pulse而不是PulseAll。这是因为每个项目只需要唤醒（至多）一个消费者。如果你只有一个冰激凌，你不会把一个班 30 个正在睡觉的孩子都叫起来排队获取它。
```
public void AddTask(Action task)
{
    lock (_locker)
    {
        _queue.Enqueue(task);
        Monitor.Pulse(_locker);
    }
}
```

模拟等待句柄

在双向信号中，你可能注意到了一个模式：_flag在当前线程被作为自旋阻塞条件，在另一线程中被设置为true，跳出自旋

lock(_locker)
{
    while (!_flag) Monitor.Wait(_locker);
	_flag = false;
}

ManualResetEvent

事实上它的工作原理就是模仿AutoResetEvent。如果去掉_flag=false，就得到了ManualResetEvent的基础版本。

private readonly object _locker = new object();
private bool _signal;
void WaitOne()
{
    lock (_locker)
    {
        while (!_signal) Monitor.Wait(_locker);
    }
}
void Set()
{
    lock (_locker)
    {
        _signal = true;
        Monitor.PulseAll(_locker);
    }
}
void Reset()
{
    lock (_locker) _signal = false;
}

使用PulseAll，是因为可能存在多个被阻塞的等待线程。而EventWaitHandle.WaitOne()的通行条件就是：门是开着的，ManualResetEvent被放行通过后不会自己关门，只能通过Reset将门关上，再次期间其它所有阻塞线程都能通行。

AutoResetEvent

实现AutoResetEvent非常简单，只需要将WaitOne方法改为：

lock (_locker)
{
    while (!_signal) Monitor.Wait(_locker);
    _signal = false;  // 添加一条，自己关门
}

然后将Set方法改为：

lock (_locker)
{
    _signal = true;
    Monitor.Pulse(_locker);  // PulseAll替换成Pulse：
}

Semaphore

把_signal替换为一个整型字段可以得到Semaphore的基础版本

public class 模拟信号量
{
    private readonly object _locker = new object();
    private int _count, _initialCount;
    public 模拟信号量(int initialCount)
    {
        _initialCount = initialCount;
    }
    
    void WaitOne()  // +1
    {
        lock (_locker)
        {
            _count++;
            while (_count >= _initialCount)
            {
                Monitor.Wait(_locker);
            }
        }
    }

    void Release()  // -1
    {
        lock (_locker)
        {
            _count --;
            Monitor.Pulse(_locker);
        }
    }
}

模拟CountdownEvent

是不是非常类似信号量？

public class 模拟CountdownEvent
{
    private object _locker = new object();
    private int _initialCount;

    public 模拟CountdownEvent(int initialCount)
    {
        _initialCount = initialCount;
    }

    public void Signal()  // +1
    {
        AddCount(-1);
    }

    public void AddCount(int amount)  // +amount
    {
        lock (_locker)
        {
            _initialCount -= amount;
            if (_initialCount <= 0) Monitor.PulseAll(_locker);
        }
    }

    public void Wait()
    {
        lock (_locker)
        {
            while (_initialCount > 0)
                Monitor.Wait(_locker);
        }
    }
}

线程会合

CountdownEvent

利用我们刚刚实现的模拟CountdownEvent,来实现两个线程的会和，和同步基础中提到的WaitHandle.SignalAndWait一样。

并且我们也可以通过initialCount将会和的线程扩展到更多个，显而易见的强大。

public class 线程会和测试
{
    private readonly ITestOutputHelper _testOutputHelper;
    private 模拟CountdownEvent _countdown = new 模拟CountdownEvent(2);

    public 线程会和测试(ITestOutputHelper testOutputHelper)
    {
        _testOutputHelper = testOutputHelper;
    }

    [Fact]
    public void Show()
    {
        // 每个线程都睡眠一段随机时间
        Random r = new Random();
        new Thread(Mate).Start(r.Next(10000));
        Thread.Sleep(r.Next(10000));

        _countdown.Signal();
        _countdown.Wait();

        _testOutputHelper.WriteLine("Mate! ");
    }

    void Mate(object delay)
    {
        Thread.Sleep((int)delay);

        _countdown.Signal(); //+1
        _countdown.Wait();

        _testOutputHelper.WriteLine("Mate! ");
    }
}

上面例子，每个线程随机休眠一段时间，然后等待对方，他们几乎在同时打印”Mate！“，这被称为线程执行屏障（thread execution barrier）

当你想让多个线程执行一个系列任务，希望它们步调一致时，可以用到线程执行屏障。然而，我们现在的解决方案有一定限制：我们不能重用同一个Countdown对象来第二次会合线程，至少在没有额外信号构造的情况下不能。为解决这个问题，Framework 4.0 提供了一个新的类Barrier。

Barrier

Framework 4.0 加入的一个信号构造。它实现了线程执行屏障（thread execution barrier），允许多个线程在一个时间点会合。这个类非常快速和高效，它是建立在Wait / Pulse和自旋锁基础上的。

实例化它，指定有多少个线程参与会合（可以调用AddParticipants / RemoveParticipants来进行更改）。
```
public Barrier(int participantCount)
```
当希望会合时，调用SignalAndWait。表示参与者已到达障碍，并等待所有其他参与者到达障碍
```
public void SignalAndWait()
```
他还实现了协作取消模式
```
public void SignalAndWait(CancellationToken cancellationToken)
```
并提供了超时时间的重载，返回一个bool类型，true标识在规定的时间，其他参与者到达障碍，false标识没有全部到达
```
public bool SignalAndWait(TimeSpan timeout)
```

实例化Barrier，参数为 3 ，意思是调用SignalAndWait会被阻塞直到该方法被调用 3 次。但与CountdownEvent不同，它会自动复位：再调用SignalAndWait仍会阻塞直到被调用 3 次。这允许你保持多个线程“步调一致”，让它们执行一个系列任务。

下边的例子中，三个线程步调一致地打印数字 0 到 4：

private readonly ITestOutputHelper _testOutputHelper;
private Barrier _barrier = new Barrier(3);
public Barrier测试(ITestOutputHelper testOutputHelper)
{
    _testOutputHelper = testOutputHelper;
}
[Fact]
void Show()
{
    new Thread(Speak).Start();
    new Thread(Speak).Start();
    new Thread(Speak).Start();
}
void Speak()
{
    for (int i = 0; i < 5; i++)
    {
        _testOutputHelper.WriteLine(i.ToString());
        _barrier.SignalAndWait();
    }
}

Barrier还提供一个非常用有的构造参数，他是一个委托，会在每个会和处执行。不用担心抢占，因为当它被执行时，所有的参与者都是被阻塞的。

public Barrier(int participantCount, Action<Barrier>? postPhaseAction)

五、拓展

前景回顾：

还记得我们在讲同步的时候提到的最小化共享数据和无状态设计吗？经过前面的学习，稍加思考，其实引发线程安全的本质是多线程并发下的数据交互问题。如果我们的数据在线程之间没有交互，或者说我们的数据都是只读的，那不就天然的线程安全了吗？

现在你能理解为什么只读字段是天然线程安全的了吗？

然而有的场景下又需要对公共数据进行读写，同步篇中我们通过很简单的排它锁来保证线程安全，在这里，我们不在满足这种粗暴的粒度（事实上多数时候读总是多于写），这时，读写锁出现了。

ReaderWriterLockSlim

ReaderWriterLockSlim在 Framework 3.5 加入的，被加入了standard 1.0，此类型是线程安全的，用于保护由多个线程读取的资源。

ReaderWriterLockSlim出现的目的是为了取缔ReaderWriterLock，他简化了递归规则以及锁状态的升级和降级规则。避免了许多潜在的死锁情况。另外，他的性能显著优于ReaderWriterLock。建议对所有新开发的项目使用ReaderWriterLockSlim

然而如果与普通的lock（Monitor.Enter / Exit）对比，他还是要慢一倍。

ReaderWriterLockSlim有三种模式：

读取模式：允许任意多的线程处于读取模式
可升级模式：只允许一个线程处于可升级模式，与读锁兼容
写入模式：完全互斥，不允许任何模式下的线程获取任何锁

ReaderWriterLockSlim定义了如下的方法来获取和释放读 / 写锁：

public void EnterReadLock();
public void ExitReadLock();
public void EnterWriteLock();
public void ExitWriteLock();

另外，对应所有EnterXXX的方法，都有相应的TryXXX版本，可以接受一个超时参数，与Monitor.TryEnter类似。

让我们来看一个案例：

模拟三个读线程，两个写线程，并行执行

new Thread(Read).Start();
new Thread(Read).Start();
new Thread(Read).Start();
new Thread(Write).Start();
new Thread(Write).Start();

读方法是这样的

while (true)
{
    _rw.EnterReadLock();
    foreach (int number in _items)
    {
        Console.WriteLine("Thread " + Thread.CurrentThread.ManagedThreadId + " added " + number);
        Thread.Sleep(100);
    }
    _rw.ExitReadLock();
}

写方法是这样的

while (true)
{
    int number = _rand.Value.Next(100);
    _rw.EnterWriteLock();
    _items.Add(number);
    _rw.ExitWriteLock();
    Console.WriteLine("Thread " + Thread.CurrentThread.ManagedThreadId + " added " + number);
    Thread.Sleep(100);
}

随机数生成方法就是用的TLS讲过的

new ThreadLocal<Random>(() => new Random(Guid.NewGuid().GetHashCode()));

需要注意ReaderWriterLockSlim实现了IDisposable，用完了请记得释放

public class ReaderWriterLockSlim : IDisposable

运行结果：

Thread 11 added 42
Thread 8 reading 42
Thread 6 reading 42
Thread 7 reading 42
Thread 10 added 98
Thread 8 reading 42
...

显而易见的，并发度变高了

锁递归

ReaderWriterLockSlim提供一个构造参数LockRecursionPolicy用于配置锁递归策略

public ReaderWriterLockSlim(LockRecursionPolicy recursionPolicy)

public enum LockRecursionPolicy
{
  /// <summary>If a thread tries to enter a lock recursively, an exception is thrown. Some classes may allow certain recursions when this setting is in effect.</summary>
  NoRecursion,
  /// <summary>A thread can enter a lock recursively. Some classes may restrict this capability.</summary>
  SupportsRecursion,
}

默认情况下是使用NoRecursion策略：不允许递归或重入，这与GO的读写锁设计不谋而合，建议使用此默认策略，因为递归引入了不必要的复杂性，并使代码更易于死锁。

public ReaderWriterLockSlim() : this(LockRecursionPolicy.NoRecursion)

开启支持递归策略后，以下代码不会抛出LockRecursionException异常

var rw = new ReaderWriterLockSlim (LockRecursionPolicy.SupportsRecursion);
rw.EnterReadLock();
rw.EnterReadLock();
rw.ExitReadLock();
rw.ExitReadLock();

递归锁定级别只能越来越小，级别顺序如下：读锁，可升级锁，写锁。下面代码会抛出LockRecursionException异常

void F()
{
    var rw = new ReaderWriterLockSlim (LockRecursionPolicy.SupportsRecursion);
    rw.EnterReadLock();
    rw.EnterWriteLock();
    rw.EnterWriteLock();
    rw.ExitReadLock();
}
Assert.Throws<LockRecursionException>(F);

可升级锁例外，把可升级锁升级为写锁是合法的。

var rw = new ReaderWriterLockSlim(LockRecursionPolicy.SupportsRecursion);
rw.EnterUpgradeableReadLock();
rw.EnterWriteLock();
rw.ExitWriteLock();
rw.ExitUpgradeableReadLock();

思考一个问题：为什么只允许一个线程处于可升级模式？

SQL Server	ReaderWriterLockSlim
共享锁（Share lock）	读锁（Read lock）
排它锁（Exclusive lock）	写锁（Write lock）
更新锁（Update lock）	可升级锁（Upgradeable lock）

Timer

如果你需要使用规律的时间间隔重复执行一些方法，这个例子会使得一个线程永远被占用

while (true)
{
    // do something
    Thread.Sleep(1000);
}

这时候你会需要Timer

创建计时器时，可以指定在方法首次执行之前等待的时间 dueTime ，以及后续执行之间等待的时间period。类 Timer 的分辨率与系统时钟相同。这意味着，如果period小于系统时钟的分辨率，委托将以系统时钟分辨率定义的时间间隔执行，在Windows 7 和Windows 8系统上大约为 15 毫秒。

public Timer(TimerCallback callback, object? state, int dueTime, int period)

下面这个例子首次间隔1s，之后间隔500ms打印tick...

Timer timer = new Timer ((data) =>
{
    _testOutputHelper.WriteLine(data.ToString());
}, "tick...", 1000, 500);
Thread.Sleep(3000);
timer.Dispose();

计时器委托是在构造计时器时指定的，不能更改。该方法不会在创建计时器的线程上执行;而是在线程池（thread pool）执行。

如果计时器间隔period小于执行回调所需的时间，或者如果所有线程池线程都在使用，并且回调被多次排队，则可以在两个线程池线程上同时执行回调。

只要使用 Timer，就必须保留对它的引用。与任何托管对象一样，当没有对其引用时，会受到垃圾回收的约束。即使 Timer 仍然处于活动状态也不会阻止它被收集。

不再需要计时器时，请调用 Dispose 释放计时器持有的资源。请注意，调用 Dispose() 后仍然可能会发生回调，因为计时器将回调排队供线程池线程执行。可以使用public bool Dispose(WaitHandle notifyObject)重载等待所有回调完成。

System.Threading.Timer是一个普通计时器。它会回调一个线程池线程（来自工作池）。

System.Timers.Timer是一个System.ComponentModel.Component ，它包装System.Threading.Timer ，并提供一些用于在特定线程上调度的附加功能。

posted @ 2022-11-15 09:09 xiaolipro 阅读(7087) 评论(9) 编辑收藏举报

刷新页面返回顶部

李鹏军