自顶向下彻底理解 Java 中的 volatile 关键字

博客已迁移至自顶向下彻底理解 Java 中的 volatile 关键字

标题 neta 自《计算机网络自顶向下》

思维导图

volatile 在 Java 中被称为轻量级 synchronized。很多并发专家引导用户远离 volatile 变量，因为使用它们要比使用锁更加容易出错。但是如果理解了 volatile 能帮助你写出更好的程序。

当读比写更多时会获得比锁好相当多的性能
比锁更好的伸缩性
比锁使用方便，只需要声明变量即可，代码量小

内存语义

volatile 的讲解

为了方便理解 volatile，用代码来表示一下加了 volatile 的效果。

给变量加上 volatile 相当于在 get 和 set 方法中加了锁。

public synchronized int getX() {
    return x;
}

public synchronized void setX(int x) {
    this.x = x;
}

注意这里只保证了get 和 set 的原子性，当有其他操作的时候就不是原子性的了。

下面的操作不是原子性的，当个 5 个线程同时执行这个方法 100 次后出现的结果很可能小于 500。

volatile int x;
public void inc() {
    x++;
}

原因是这个程序相当于

int x;
public synchronized int getX() {
    return x;
}

public synchronized void setX(int x) {
    this.x = x;
}
public void inc() {
    int temp = getX(); // 1
    temp += 1; // 2
    setX(temp); // 3
}

可以看出即使 get 和 set 操作是原子性的，整个操作也不是原子性的。

当两个线程 A ， B 同时执行 inc时，可能会出现

A-1 得到 x = 1

B-1 得到 x = 1

A-2 temp 为 2

B-2 temp 为 2

A-3 x 被设为 2

B-3 x 被设为 2

在执行完毕后 x 的值只增加了 1。

原子性和可见性

我们在 JMM 中讲解 volatile 的内存语义。可以参照着这篇看。JVM内存模型、指令重排、内存屏障概念解析

volatile 保证了新的值能立刻同步到主内存中，以及每次使用前都到主内存刷新。

volatile 通过在写入变量的时候，JVM 会向 CPU 发送一个 lock 前缀指令将变量同步入主内存

而当出现了这个命令以后，所有其他线程上的缓存就会被强制设置成无效，当下次要用到这个变量的时候需要去主内存中取。

通过 Lock 指令

每次使用变量之前都必须先从主内存刷新最新的值。

每次修改变量后都必须立即同步回主内存中，保证其他线程可以看到最新的值。

一个比较有用的抽象：把加了 volatile 的变量当作是没有中间的缓存，所有的数据操作都是在主内存上的。

禁止指令重排

CPU 和编译器为了执行效率，会将指令重排序。如果不知道的可以参照上面那一片博文来对照着读。

volatile 修饰变量不会被指令重排优化，保证代码执行顺序和程序顺序相同。

在几个地方会插入 StoreStore 和 StoreLoad 阻止重排序。

在 volatile 写前插入 StoreStore 屏障，写后插入 StoreLoad 屏障
在 volatile 读前插入 LoadLoad 屏障，读后插入 LoadStore 屏障

这样的效果就是，在 volatile 写前的操作不能排到它后面。在 volatile 读后的操作不能排到它前面。

如果不知道这两个指令可以看一下上面的博客。 // TODO 马上写完 (咕咕咕

正确的使用 volatile

正确使用 volatile 依赖于

对变量的写操作不依赖于当前值
该变量没有包含在具有其他变量的不变式中

状态标志

也许实现 volatile 变量的规范使用仅仅是使用一个布尔状态标志，用于指示发生了一个重要的一次性事件，比如游戏结束，将游戏正在进行的 flag 设置为 false，通知绘图线程停止。

volatile boolean flag = false;
private void waiting() {
    while(!flag) {
        // do something
    }
}

一次性安全发布

一次性安全分布用于双重检查实现单例模式。

private volatile SingleTest instance;
SingleTest getInstance() {
    if (instance == null) {
        synchronized (SingleTest.class) {
            if (instance == null) {
                instance = new SingleTest();
            }
        }
    }
    return instance;
}

为什么要用到 volatile 呢？因为新建类分为三步

分配内存空间
初始化对象
设置内存地址，初始化引用

在这里第二步可能重排序，这时候可能会将没有初始化成功就把对象发布出去了，所以需要 volatile 来阻止指令重排。

独立观察

安全使用 volatile 的另一种简单模式是：定期 “发布” 观察结果供程序内部使用。例如，假设有一种环境传感器能够感觉环境温度。一个后台线程可能会每隔几秒读取一次该传感器，并更新包含当前文档的 volatile 变量。然后，其他线程可以读取这个变量，从而随时能够看到最新的温度值。

使用该模式的另一种应用程序就是收集程序的统计信息。清单 4 展示了身份验证机制如何记忆最近一次登录的用户的名字。将反复使用 lastUser 引用来发布值，以供程序的其他部分使用。

该模式是前面模式的扩展；将某个值发布以在程序内的其他地方使用，但是与一次性事件的发布不同，这是一系列独立事件。这个模式要求被发布的值是有效不可变的 —— 即值的状态在发布后不会更改。使用该值的代码需要清楚该值可能随时发生变化。

volatile bean 模式

volatile bean 是线程安全的。在 volatile bean 模式中，JavaBean 被用作一组具有 getter 和/或 setter 方法的独立属性的容器。

在 volatile bean 模式中，

JavaBean 的所有数据成员都是 volatile 类型的
并且 getter 和 setter 方法除了获取或设置相应的属性外，不能包含任何逻辑。、
此外，对于对象引用的数据成员，引用的对象必须是有效不可变的。（这将禁止具有数组值的属性，因为当数组引用被声明为 volatile 时，只有引用而不是数组本身具有 volatile 语义）

@ThreadSafe
public class Person {
    private volatile String firstName;
    private volatile String lastName;
    private volatile int age;
 
    public String getFirstName() { return firstName; }
    public String getLastName() { return lastName; }
    public int getAge() { return age; }
 
    public void setFirstName(String firstName) { 
        this.firstName = firstName;
    }
 
    public void setLastName(String lastName) { 
        this.lastName = lastName;
    }
 
    public void setAge(int age) { 
        this.age = age;
    }
}

对于 volatile 的优化

在 JDK 7 并发包里新增了一个队列集合 LinkedTransferQueue，它在使用 volatile 变量时，用一种追加字节的方式来优化出队和入队的性能。

它将变量追加到了 64 字节来提高性能。

64 位 CPU 在队列中的元素不足 64 个字节时会将多个元素读入一个缓存行中，在多线程当读取一个元素的时候会锁住这个缓存行，进而导致这个元素附近的元素都不能被读取。

如果一个变量为 64 字节，那么每个元素都被读入不同的缓存中，相邻队列元素就能被不同线程同时访问了。

参考文献

周志明. 深入理解 Java 虚拟机 [M]. 机械工业出版社, 2011.
方腾飞.Java 并发编程的艺术 [M]. 机械工业出版社, 2015.
正确使用 Volatile 变量
JVM内存模型、指令重排、内存屏障概念解析

posted @ 2018-10-14 19:48 zjmeow 阅读(214) 评论(0) 编辑收藏举报

刷新页面返回顶部

zjmeow