Java中的可见性问题

前言

编程中可见性、原子性、有序性导致的问题常常会违背我们的直觉,从而成为并发编程的 Bug 之源。这三者在编程领域属于共性问题,所有的编程语言都会遇到,Java 在诞生之初就支持多线程,自然也有针对这三者的技术方案,而且在编程语言领域处于领先地位。理解 Java 解决并发问题的解决方案,对于理解其他语言的解决方案有触类旁通的效果。

那我们就先来聊聊如何解决其中的可见性和有序性导致的问题,这也就引出来了今天的主角——Java 内存模型

什么是 Java 内存模型?

你已经知道,导致可见性的原因是缓存,导致有序性的原因是编译优化,那解决可见性、有序性最直接的办法就是禁用缓存和编译优化,但是这样问题虽然解决了,我们程序的性能可就堪忧了。

合理的方案应该是按需禁用缓存以及编译优化。那么,如何做到“按需禁用”呢?对于并发程序,何时禁用缓存以及编译优化只有程序员知道,那所谓“按需禁用”其实就是指按照程序员的要求来禁用。所以,为了解决可见性和有序性问题,只需要提供给程序员按需禁用缓存和编译优化的方法即可。

Java 内存模型是个很复杂的规范,可以从不同的视角来解读,站在我们这些程序员的视角,本质上可以理解为,Java 内存模型规范了 JVM 如何提供按需禁用缓存和编译优化的方法。具体来说,这些方法包括 volatilesynchronizedfinal 三个关键字,以及六项 Happens-Before 规则,这也正是本期的重点内容。掌握这些方法,我们就可以按需地禁用缓存和编译优化了,也就掌握了Java内存模型最核心的东西。

程序的顺序性

在分析Happens-Before规则之前,一定要搞懂程序的顺序性。程序的顺序性指在编译器以及CPU优化情况下(编译器&CPU优化会破坏程序执行顺序),保证程序以单线程方式执行时,其结果的不变性。举个例子,在单线中,下面的程序不论重复多少次(先执行writer后执行reader),最后始终会输出42。这只对单线程程序而言,多线程程序(一个线程执行writer,另一个线程执行reader)中可能会输出0。

class Example {

  int x = 0;
  boolean v = false;
  
  public void writer() {
    this.x = 42;
    this.v = true;
  }

  public void reader() {
    while (true) {
      if (v) {
        print(x);
        return;
      }
    }
  }
}

程序的顺序性在任何CPU,任何编程语言中都需遵守的基本规则,因此Java语言或者说Java内存模型天然支持的。因此,Happens-Before规则其实应用于多线程场景,我们在编写多线程程序时一定要考虑到Happens-Before规则的使用。

Happens-Before 规则

如何理解 Happens-Before 呢?如果望文生义(很多网文也都爱按字面意思翻译成“先行发生”),那就南辕北辙了,Happens-Before 并不是说前面一个操作发生在后续操作的前面,它真正要表达的是:前面一个操作的结果对后续操作是可见的。就像有心灵感应的两个人,虽然远隔千里,一个人心之所想,另一个人都看得到。Happens-Before 规则就是要保证线程之间的这种“心灵感应”。所以比较正式的说法是:Happens-Before 约束了编译器的优化行为,虽允许编译器优化,但是要求编译器优化后一定遵守 Happens-Before 规则。

Happens-Before 规则应该是 Java 内存模型里面最晦涩的内容了,和程序员相关的规则一共有如下七项,都是关于可见性的。

恰好前面示例代码涉及到这六项规则中的前三项,为便于你理解,我也会分析上面的示例代码,来看看规则 1、2 和 3 到底该如何理解。至于其他三项,我也会结合其他例子作以说明。

volatile 变量规则

这条规则是指对一个 volatile 变量的写操作, Happens-Before 于后续对这个 volatile 变量的读操作,即被volatile修饰的变量写对读是可见的,确保线程在执行读操作时始终拿到的是新值。同时volatile禁止重排序功能,被volatile修饰的变量在进行读写时,这些变量是不能重排序;volatile变量前后的读写操作不能重排序

volatile int a;
volatile int b;
volatile int c;
int d;
int e;
int f;

//(1)(2)(3)不能重排序
a=10;     (1)
b=20;     (2)
c=30;     (3)

//将(5)看成一堵障碍,其前后的操作不能跨越障碍
//因此(4)不能滞后于(5)执行,(6)(7)不能先于(5执行),但(6)(7)可以重排序执行
d=40;     (4)
b=50;     (5)
e=60;     (6)
f=70;     (7)

传递性规则

这条规则是指如果 A Happens-Before B,且 B Happens-Before C,那么 A Happens-Before C。

在解释传递性规则之前先修改开始出现的那段代码,用volatile修饰v变量

class Example {

  int x = 0;
  volatile boolean v = false;
  
  public void writer() {
    this.x = 42;
    this.v = true;
  }

  public void reader() {
    while (true) {
      if (v) {
        print(x);
        return;
      }
    }
  }
}

我们将传递性应用到我们的例子中,会发生什么呢?可以看下面这幅图:

11

示例代码中的传递性规则

从图中,我们可以看到:

“x=42” Happens-Before 写变量 “v=true” ,这是volatile规则的内容;

写变量“v=true” Happens-Before 读变量 “v=true”,这是volatile规则的内容 。

再根据这个传递性规则,我们得到结果:“x=42” Happens-Before 读变量“v=true”。这意味着什么呢?

如果线程 B 读到了“v=true”,那么线程 A 设置的“x=42”对线程 B 是可见的。也就是说,线程 B 能看到 “x == 42”

管程中锁的规则

这条规则是指对一个锁的解锁 Happens-Before 于后续对这个锁的加锁,且被锁保护的共享资源在进行写操作时对其他线程可见。

要理解这个规则,就首先要了解“管程指的是什么”。管程是一种通用的同步原语,在 Java 中指的就是 synchronized,synchronized 是 Java 里对管程的实现。

管程中的锁在 Java 里是隐式实现的,例如下面的代码,在进入同步块之前,会自动加锁,而在代码块执行完会自动释放锁,加锁以及释放锁都是编译器帮我们实现的。

synchronized (this) { //此处自动加锁
  // x是共享变量,初始值=10
  if (this.x < 12) {
  	this.x = 12; 
  }  
} //此处自动解锁

所以结合规则 4——管程中锁的规则,可以这样理解:假设 x 的初始值是 10,线程 A 执行完代码块后 x 的值会变成 12(执行完自动释放锁),线程 B 进入代码块时,能够看到线程 A 对 x 的写操作,也就是线程 B 能够看到 x==12。

线程 start() 规则

这条是关于线程启动的。它是指主线程 A 启动子线程 B 后,子线程 B 能够看到主线程在启动子线程 B 前的操作。

换句话说就是,如果线程 A 调用线程 B 的 start() 方法(即在线程 A 中启动线程 B),那么该 start() 操作 Happens-Before 于线程 B 中的任意操作。具体可参考下面示例代码。

Thread B = new Thread(()->{
  // 主线程调用B.start()之前
  // 所有对共享变量的修改,此处皆可见
  // 此例中,var==77

});

// 此处对共享变量var修改
var = 77;

// 主线程启动子线程
B.start();

线程 join() 规则

这条是关于线程等待的。它是指主线程 A 等待子线程 B 完成(主线程 A 通过调用子线程 B 的 join() 方法实现),当子线程 B 完成后(主线程 A 中 join() 方法返回),主线程能够看到子线程的操作。当然所谓的“看到”,指的是对共享变量的操作。

换句话说就是,如果在线程 A 中,调用线程 B 的 join() 并成功返回,那么线程 B 中的任意操作 Happens-Before 于该 join() 操作的返回。具体可参考下面示例代码。

Thread B = new Thread(()->{

  // 此处对共享变量var修改
  var = 66;

});

// 例如此处对共享变量修改,
// 则这个修改结果对线程B可见
// 主线程启动子线程

B.start();

B.join()

// 子线程所有对共享变量的修改
// 在主线程调用B.join()之后皆可见
// 此例中,var==66

线程中断规则

对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生

//线程A此处对共享变量var修改
var = 66

//中断线程B
B.interrupt()

线程B被中断后,线程B看到共享变量var的值应为66

final规则

前面我们讲 volatile 为的是禁用缓存以及编译优化,我们再从另外一个方面来看,有没有办法告诉编译器优化得更好一点呢?这个可以有,就是 final 关键字

final 修饰变量时,初衷是告诉编译器:这个变量生而不变,可以可劲儿优化。Java 编译器在 1.5 以前的版本的确优化得很努力,以至于都优化错了。但是final使用不当会导致对象“逸出”。

“逸出”有点抽象,我们还是举个例子吧,在下面例子中,在构造函数里面将 this 赋值给了全局变量 global.obj,这就是“逸出”,线程通过 global.obj 读取 x 是有可能读到 0 的。因此我们一定要避免“逸出”。

因此在编程时最好不要在构造函数中把this赋值给一个全局变量。

final int x;

// 错误的构造函数
public FinalFieldExample() { 
  x = 3;
  y = 4;
  // 此处就是讲this逸出,
  global.obj = this;
}

总结

Java 的内存模型是并发编程领域的一次重要创新,之后 C++、C#、Golang 等高级语言都开始支持内存模型。Java 内存模型里面,最晦涩的部分就是 Happens-Before 规则了,Happens-Before 规则最初是在一篇叫做 Time, Clocks, and the Ordering of Events in a Distributed System 的论文中提出来的,在这篇论文中,Happens-Before 的语义是一种因果关系。在现实世界里,如果 A 事件是导致 B 事件的起因,那么 A 事件一定是先于(Happens-Before)B 事件发生的,这个就是 Happens-Before 语义的现实理解。

在 Java 语言里面,Happens-Before 的语义本质上是一种可见性,A Happens-Before B 意味着 A 事件对 B 事件来说是可见的,无论 A 事件和 B 事件是否发生在同一个线程里。例如 A 事件发生在线程 1 上,B 事件发生在线程 2 上,Happens-Before 规则保证线程 2 上也能看到 A 事件的发生。

Java 内存模型主要分为两部分,一部分面向你我这种编写并发程序的应用开发人员,另一部分是面向 JVM 的实现人员的,我们可以重点关注前者,也就是和编写并发程序相关的部分,这部分内容的核心就是 Happens-Before 规则。相信经过本章的介绍,你应该对这部分内容已经有了深入的认识。

参考

JSR-133: JavaTMMemory Model and Thread Specification
Java 内存模型 FAQ

posted @ 2020-01-29 12:35  被罚站的树  阅读(3216)  评论(0编辑  收藏  举报