解决cpu高速缓存技术潜在问题：缓存一致性问题

1、缓存一致性问题？

为了压榨cpu性能，解决cpu算数逻辑单元(ALU) 直接访问内存速度低的问题，cpu 内部有了高速缓存，把内存中的数据读取到内部高速缓存中来，避免直接访问内存，以加快 ALU 频繁读取的速度。我们假设在一台 pc 上只有一个单核的 cpu 和一份内部高速缓存，那么所有的进程和线程看到的数据都是一致的，不会存在问题。但是现在的服务器通常都是多 cpu，每个cpu里有多个核心，而且每个核心都维护了自己的高速缓存，那么这个时候多线程并发就会存在 缓存不一致性问题，会导致严重问题。

以 i++ 为例，i 的初始值为 0，两个内核都缓存了 i=0，当第一块内核做 i++ 的时候，其缓存中的值变成了 1，即使马上回写到主内存，在第一块内核回写之后，第二块内核缓存中的i值依然为 0，其执行 i++，回写到内存就会覆盖第一块内核的操作，使得最终的结果为 1，而不是预期中的 2。

2、解决缓存一致性问题

怎么解决这个问题，在早期的 CPU 当中，是通过 cpu 在总线上发LOCK#信号的形式来解决缓存不一致的问题。因为 CPU 和其他部件进行通信都是通过总线来进行的，如果对总线发LOCK#信号锁定总线的话，也就是说阻塞了其他CPU对其他部件访问（如内存），从而使得只能有一个 CPU 能使用这个变量的内存，锁定期间，其他处理器不能操作其他内存地址的数据。

但我们只需要对此共享变量的操作是原子就可以了，而总线锁定把 cpu 和内存的通信给锁住了，使得在锁定期间，其他处理器不能操作其它内存地址的数据，从而 cpu 效率低下，所以后来的 cpu 都提供了缓存一致性机制（Intel的P6之后就提供了这种优化-缓存一致性机制。）。

缓存一致性协议最出名的就是 Intel 的 MESI 协议，MESI协议保证了每个缓存中使用的共享变量的副本是一致的。它核心的思想是：当CPU写数据时，如果发现操作的变量是共享变量，即在其他CPU中也存在该变量的副本，会发出信号通知其他CPU将该变量的缓存行置为无效状态，因此当其他CPU需要读取这个变量时，发现自己缓存中缓存该变量的缓存行是无效的，那么它就会从内存重新读取。

总结：为了解决缓存不一致的问题，在 CPU 层面，主要提供了两种解决办法（这2种方式都是硬件层面上提供的方式。）：

2.1、总线锁

cpu向总线发出LOCK#信号，首先锁定总线，此cpu独享内存。

2.2、缓存锁

cpu向总线发出LOCK#信号，首先根据缓存一致性机制，保存操作原子性。共享变量的所有副本一致。

注意：lock指令底层是总线锁还是缓存锁

相比总线锁，缓存锁即降低了锁的力度。核心机制是基于缓存一致性协议来实现的。为了达到数据访问的一致，需要各个处理器在访问缓存时遵循一些协议，在读写时根据协议来操作，常见的协议有 MSI、MESI、MOSI 等。最常见的就是 MESI 协议。
在 MESI 协议中，每个缓存的缓存控制器不仅知道自己的读写操作，而且也监听(snoop)其它 Cache 的读写操作。