Java并发编程学习笔记4——共享模型之内存
目录
3.4.3、double-checked locking问题
1、Java内存模型
JMM(Java Memory Model),它定义了主存、工作内存等抽象概念,底层对应着CPU寄存器、缓存、硬件内存、CPU指令优化等。
JMM体现在以下几个方面:
- 原子性:保证指令不会受到线程上下文切换的影响;
- 可见性:保证指令不会受CPU缓存的影响;
- 有序性:保证指令不会受CPU指令并行优化的影响。
2、可见性
2.1、退不出的循环
先来看一个现象,main线程对run变量的修改对于t线程不可见,导致了t线程无法停止。
public class Test1 {
private static final Logger LOGGER = LoggerFactory.getLogger(Test1.class);
static boolean run = true;
public static void main(String[] args) throws InterruptedException {
Thread t = new Thread(()->{
while (run) {
// ...
}
});
t.start();
Thread.sleep(1000);
LOGGER.debug("停止t");
run = false; // 线程t不会如预想的停下来
}
}
// 结果:
19:35:44.615 [main] DEBUG com.multiThreads.test13.Test1 - 停止t
(并没有终止)
为什么呢?分析一下:
- 初始状态:t线程刚开始从主存内读取了run的值到工作内存。
- 因为t线程要频繁从主内存中读取run的值,JIT编译器会将run的值缓存至自己工作内存中的高速缓存中,减少对主存中run的访问,提高效率。
- 1秒之后,main线程修改了run的值,并同步至主存,而t是从自己工作内存中的高速缓存中读取这个变量的值,结果永远是旧值。
2.2、解决方法
volatile(易变关键字)。
它可以用来修饰成员变量和静态成员变量,它可以避免线程从自己的工作缓存中查找变量的值,必须到主存中获取它的值,线程操作volatile变量都是直接操作主存。
public class Test1 {
private static final Logger LOGGER = LoggerFactory.getLogger(Test1.class);
// 方式1:易变关键字
static volatile boolean run = true;
// 方式2:锁对象
final static Object lock = new Object();
public static void main(String[] args) throws InterruptedException {
Thread t = new Thread(()->{
while (run) {
// ...
}
});
t.start();
Thread.sleep(1000);
LOGGER.debug("停止t");
run = false;
}
}
结果:
19:35:44.615 [main] DEBUG com.multiThreads.test13.Test1 - 停止t
Process finished with exit code 0
2.3、可见性 vs 原子性
前面例子体现的实际就是可见性,它保证的是在多个线程之间,一个线程对volatile变量的修改对另一个线程可见,不能保证原子性,仅用在一个写线程,多个读线程的情况。volatile只能保证看到最新值,不能解决指令交错。
注意:synchronized语句块既可以保证代码块的原子性,也同时保证代码块内变量的可见性。但缺点是synchronized是属于重量级曹总,性能相对更低。
2.3.1、设计模式——终止模式之两阶段终止模式
两阶段终止(Two Termination):在一个线程T1中如何“优雅”终止线程T2?这里的【优雅】指的是给T2一个料理后事的机会。
1、错误思路
- 使用线程对象的stop()方法停止线程:stop()方法会真正杀死线程,如果这时线程锁住了共享资源,那么当它被杀死后就再也没有机会释放锁,其它线程将永远无法获得锁;
- 使用System.exit(int)方法停止线程:目的仅是停止一个线程,但这种做法会让整个程序都停止。
2、正确思路
public class Test {
private static final Logger LOGGER = LoggerFactory.getLogger(Test.class);
public static void main(String[] args) throws InterruptedException {
TwoPhaseTermination tpt = new TwoPhaseTermination();
tpt.start();
Thread.sleep(3500);
LOGGER.debug("停止监控");
tpt.stop();
}
}
class TwoPhaseTermination {
private static final Logger LOGGER = LoggerFactory.getLogger(TwoPhaseTermination.class);
// 监控线程
private Thread monitorThread;
// 是否停止
private volatile boolean isStop;
// 启动监控线程
public void start() {
monitorThread = new Thread(()->{
while(true) {
Thread currentThread = Thread.currentThread();
// 是否被打断
if (isStop) {
LOGGER.debug("料理后事");
break;
}
try {
Thread.sleep(1000);
LOGGER.debug("执行监控记录");
} catch (InterruptedException e) {
// 该异常会清空打断标记(isInterrupt = false)
e.printStackTrace();
}
}
}, "monitor");
monitorThread.start();
}
// 停止监控线程
public void stop() {
isStop = true;
monitorThread.interrupt();
}
}
结果:
10:53:31.821 [monitor] DEBUG com.multiThreads.test14.TwoPhaseTermination - 执行监控记录
10:53:32.825 [monitor] DEBUG com.multiThreads.test14.TwoPhaseTermination - 执行监控记录
10:53:33.839 [monitor] DEBUG com.multiThreads.test14.TwoPhaseTermination - 执行监控记录
10:53:34.324 [main] DEBUG com.multiThreads.test14.Test - 停止监控
10:53:34.324 [monitor] DEBUG com.multiThreads.test14.TwoPhaseTermination - 料理后事
java.lang.InterruptedException: sleep interrupted
at java.lang.Thread.sleep(Native Method)
at com.multiThreads.test14.TwoPhaseTermination.lambda$start$0(Test.java:38)
at java.lang.Thread.run(Thread.java:748)
[点击并拖拽以移动]
2.3.2、设计模式——同步模式之Balking
Balking(犹豫)模式用在一个线程发现另一个线程或本线程已经做了某一件相同的事,那么本线程就无需再做了,直接结束返回。
例如:
public class Test {
private static final Logger LOGGER = LoggerFactory.getLogger(Test.class);
public static void main(String[] args) throws InterruptedException {
TwoPhaseTermination tpt = new TwoPhaseTermination();
tpt.start();
tpt.start();
tpt.start();
Thread.sleep(3500);
LOGGER.debug("停止监控");
tpt.stop();
}
}
class TwoPhaseTermination {
private static final Logger LOGGER = LoggerFactory.getLogger(TwoPhaseTermination.class);
// 监控线程
private Thread monitorThread;
// 是否停止
private volatile boolean isStop = false;
// 判断是否执行过start()方法
private boolean starting = false;
// 启动监控线程
public void start() {
synchronized (this) {
if (starting) {
return;
}
starting = true;
}
monitorThread = new Thread(() -> {
while (true) {
Thread currentThread = Thread.currentThread();
// 是否被打断
if (isStop) {
LOGGER.debug("料理后事");
break;
}
try {
Thread.sleep(1000);
LOGGER.debug("执行监控记录");
} catch (InterruptedException e) {
// 该异常会清空打断标记(isInterrupt = false)
e.printStackTrace();
}
}
}, "monitor");
monitorThread.start();
}
// 停止监控线程
public void stop() {
isStop = true;
monitorThread.interrupt();
}
}
结果:
11:09:35.158 [monitor] DEBUG com.multiThreads.test14.TwoPhaseTermination - 执行监控记录
11:09:36.161 [monitor] DEBUG com.multiThreads.test14.TwoPhaseTermination - 执行监控记录
11:09:37.163 [monitor] DEBUG com.multiThreads.test14.TwoPhaseTermination - 执行监控记录
11:09:37.665 [main] DEBUG com.multiThreads.test14.Test - 停止监控
11:09:37.665 [monitor] DEBUG com.multiThreads.test14.TwoPhaseTermination - 料理后事
java.lang.InterruptedException: sleep interrupted
at java.lang.Thread.sleep(Native Method)
at com.multiThreads.test14.TwoPhaseTermination.lambda$start$0(Test.java:49)
at java.lang.Thread.run(Thread.java:748)
Process finished with exit code 0
3、有序性
JVM会在不影响正确性的前提下,可以调整语句的执行顺序。思考下面一段代码:
static int i;
static int j;
// 在某个线程内执行如下赋值操作
i = ...;
j = ...;
可以看到,至于是先执行i还是先执行j,对最终的结果不会产生影响。所以,上面代码真正执行时,既可以是:
i = ...;
j = ...;
也可以是:
j = ...;
i = ...;
这种特性称之为【指令重排】,多线程下【指令重排】会影响正确性。
3.1、指令重排序优化
事实上,现代处理器会设计为一个时钟周期完成一条执行时间最长的CPU指令。为什么这么做呢?可以想到指令还可以再划分为一个个更小的阶段,例如,每条指令都可以分为:取指令-指令译码-执行指令-内存访问-数据写回这5个阶段。
术语参考:
- Instruction Fetch(IF);
- Instruction Decode(ID);
- Execute(EX);
- Memory Access(MEM);
- Register Write Back(WB)。
在不改变程序结果的前提下,这些指令的各个阶段可以通过重排序和组合来实现指令级并行,这一技术在80年代到90年代中叶占据了计算机架构的重要地位。
提示:分阶段、分工是提升效率的关键!
3.2、支持流水线的处理器
现代CPU支持多级指令流水线,例如支持同时执行 取指令-指令译码-执行指令-内存访问-数据写回 的处理器,就可以称之为五级指令流水线。这时CPU可以在一个时钟周期内,同时运行这5条指令的不同阶段(相当于一条执行时间最长的复杂指令),IPC=1,本质上,流水线技术并不能缩短单条指令的执行时间,但它变相地提高了指令的吞吐率。
提示:奔腾四(Pentium 4)支持高达35级流水线,但由于功耗太高被废弃。
3.3、诡异的结果
int num = 0;
boolean ready = false;
// 线程1执行此方法
public void actor1(I_Result r) {
if (ready) {
r.r1 = num + num;
} else {
r.r1 = 1;
}
}
// 线程2执行此方法
public void actor2(I_Result r) {
num = 2;
ready = true;
}
I_Result是一个对象,有一个属性r1用来保存结果,问,可能的结果有几种?
有同学这么分析:
- 情况1:线程1先执行,这时ready = false,所以进入else分支结果为1;
- 情况2:线程2先执行num = 2,但还没来得及执行ready = true,线程1执行,还是进入else分支,结果为1;
- 情况3:线程2执行到ready = true,线程1执行,这回进入if分支,结果为4(因为num已经执行过了)。
实际上结果还有可能是0,这种情况下:线程2执行ready=true,切换到线程1,进入if分支,相加为0,再切回线程2执行num=2。
这种现象就是指令重排,是JIT编译器在运行时的一些优化,这个现象需要通过大量测试才能复现。
3.4、volatile原理
volatile的底层实现原理是内存屏障,Memory Barrier (Memory Fence)。
- 对volatile变量的写指令后会加入写屏障;
- 对lovatile变量的读指令前会加入读屏障。
3.4.1、如何保证可见性
写屏障(sfence)保证在该屏障之前的,对共享变量的改动,都同步到主存当中:
public void actor2(I_Result r) {
num = 2;
ready = true; // ready 是 volatile赋值带写屏障
// 写屏障
}
而读屏障(ifence)保证在读屏障之后,对共享变量的读取,加载的是主存中最新数据:
public void actor1(I_Result r) {
// 读屏障
// ready 是 volatile 读取值带读屏障
if (ready) {
r.r1 = num + num;
} else {
r.r1 = 1;
}
}
3.4.2、如何保证有序性
写屏障会确保指令重排序时,不会将写屏障之前的代码排在写屏障之后:
public void actor2(I_Result r) {
num = 2;
ready = true; // ready 是 volatile赋值带写屏障
// 写屏障
}
读屏障会确保指令重排序时,不会将读屏障之后的代码排在读屏障之前:
public void actor1(I_Result r) {
// 读屏障
// ready 是 volatile 读取值带读屏障
if (ready) {
r.r1 = num + num;
} else {
r.r1 = 1;
}
}
还是那句话,不能解决指令交错:
- 写屏障仅仅是保证之后的读能够读到最新的结果,但不能保证读跑到它前面去;
- 而有序性的保证也只是保证了本线程内相关代码不被重排序。
3.4.3、double-checked locking问题
以著名的double-checked locking单例模式为例:
class Singleton {
private Singleton() {}
private static Singleton INSTANCE = null;
public static synchronized Singleton getInstance() {
if (INSTANCE == null) {
INSTANCE = new Singleton();
}
return INSTANCE;
}
}
以上的实现特点是:
- 懒惰实例化;
- 首次使用getInstance()才使用synchronized加锁,后续使用时无需加锁;
- 有隐含的,但很关键的一点:第一个if使用了INSTANCE变量,是在同步块之外。
但在多线程环境下,上面的代码是有问题的。
3.4.4、happens-before
happens-before规定了对共享变量的写操作对其他线程的读操作可见,它是可见性与有序性的一套规则总结,抛开以下happens-before规则,JMM并不能保证一个线程对共享变量的写,对于其他线程对该共享变量的读可见。
- 线程解锁m之前对变量的写,对于接下来对m加锁的其它线程对该变量的读可见。
public class Test1 { static int x; static Object m = new Object(); public static void main(String[] args) { new Thread(()->{ synchronized (m) { x = 10; } },"t1").start(); new Thread(()->{ synchronized (m) { System.out.println(x); } },"t2").start(); } } 结果:10
- 线程对volatile变量的写,对接下来其它线程对该变量的读可见:
public class Test1 { volatile static int x; public static void main(String[] args) { new Thread(()->{ x = 10; },"t1").start(); new Thread(()->{ System.out.println(x); },"t2").start(); } } 结果:10
- 线程start前对变量的写,对该线程开始后对该变量的读可见:
public class Test1 { static int x; public static void main(String[] args) { x = 10; new Thread(()->{ System.out.println(x); },"t2").start(); } }
- 线程结束前对变量的写,对其他线程得知它结束之后的读可见(比如其他线程调用t1.isAlive()或t1.join()等待它结束):
public class Test1 { static int x; public static void main(String[] args) throws InterruptedException { Thread t1 = new Thread(() -> { x = 10; }, "t1"); t1.start(); t1.join(); System.out.println(x); } } 结果:10
- 线程t1打断t2(interrupt)前对变量的写,对于其他线程得知t2被打断后对变量的读可见(通过t2.interrupted或t2.isInterrupted())。
public class Test1 { static int x; public static void main(String[] args) throws InterruptedException { Thread t2 = new Thread(()->{ while(true) { if (Thread.currentThread().isInterrupted()) { System.out.println(x); break; } } }, "t2"); t2.start(); new Thread(()->{ try { Thread.sleep(1000); x = 10; t2.interrupt(); } catch (InterruptedException e) { e.printStackTrace(); } }, "t1").start(); while(!t2.isInterrupted()) { Thread.yield(); } System.out.println(x); } } 结果: 10 10
- 对变量默认值(0,false,null)的写,对其它线程对该变量的读可见;
- 具有传递性,如果x hb-> y并且y hb-> z,那么有x hb-> z,配合volatile的防指令重排,有下面的例子:
public class Test2 { volatile static int x; static int y; public static void main(String[] args) { new Thread(()->{ y = 10; x = 20; }).start(); new Thread(()->{ // x=20对t2可见,同时y=10也对t2可见 System.out.println(x); }, "t2").start(); } }