导致并发程序出问题的根本原因是什么？

CPU、内存、IO 设备的读写速度差异巨大，表现为 CPU 的速度 > 内存的速度 > IO 设备的速度。

程序的性能瓶颈在于速度最慢的 IO 设备的读写，也就是说当涉及到 IO 设备的读写，再怎么提升 CPU 和内存的速度也是起不到提升性能的作用。

为了更好地利用 CPU 的高性能

计算机体系结构，给 CPU 增加了缓存，均衡 CPU 和内存的速度差异
操作系统，增加了进程与线程，分时复用 CPU，均衡 CPU 和 IO 设备的速度差异
编译器，增加了指令执行重排序，更好地利用缓存，提高程序的执行速度

基于以上优化，给并发编程带来了三大问题。

1、 CPU 缓存，在多核 CPU 的情况下，带来了可见性问题

可见性：一个线程对共享变量的修改，另一个线程能够立刻看到修改后的值

看下面代码，启动两个线程，一个线程当 stop 变量为 true 时，停止循环，一个线程启动就设置 stop 变量为 true。

package constxiong.concurrency.a014;

/**
 * 测试可见性问题
 * @author ConstXiong
 */
public class TestVisibility {

    //是否停止 变量
    private static boolean stop = false;
    
    public static void main(String[] args) throws InterruptedException {
        //启动线程 1，当 stop 为 true，结束循环
        new Thread(() -> {
            System.out.println("线程 1 正在运行...");
            while (!stop) ;
            System.out.println("线程 1 终止");
        }).start();
        
        //休眠 10 毫秒
        Thread.sleep(10);
        
        //启动线程 2， 设置 stop = true
        new Thread(() -> {
            System.out.println("线程 2 正在运行...");
            stop = true;
            System.out.println("设置 stop 变量为 true.");
        }).start();
    }
    
}

打印结果：

这个就是因为 CPU 缓存导致的可见性导致的问题。线程 2 设置 stop 变量为 true，线程 1 在 CPU 1上执行，读取的 CPU 1 缓存中的 stop 变量仍然为 false，线程 1 一直在循环执行。

示意如图：

可以通过 volatile、synchronized、Lock接口、Atomic 类型保障可见性。

2、操作系统对当前执行线程的切换，带来了原子性问题

原子性：一个或多个指令在 CPU 执行的过程中不被中断的特性

看下面的一段代码，线程 1 和线程 2 分别对变量 count 增加 10000，但是结果 count 的输出却不是 20000

package constxiong.concurrency.a014;

/**
 * 测试原子性问题
 * @author ConstXiong
 */
public class TestAtomic {
    
    //计数变量
    static volatile int count = 0;

    public static void main(String[] args) throws InterruptedException {
        //线程 1 给 count 加 10000
        Thread t1 = new Thread(() -> {
            for (int j = 0; j < 10000; j++) {
                count++;
            }
            System.out.println("thread t1 count 加 10000 结束");
        });
        
        //线程 2 给 count 加 10000
        Thread t2 = new Thread(() -> {
            for (int j = 0; j < 10000; j++) {
                count++;
            }
            System.out.println("thread t2 count 加 10000 结束");
        });
        
        //启动线程 1
        t1.start();
        //启动线程 2
        t2.start();
        
        //等待线程 1 执行完成
        t1.join();
        //等待线程 2 执行完成
        t2.join();
        
        //打印 count 变量
        System.out.println(count);
    }
    
}

打印结果：

thread t2 count 加 10000 结束
thread t1 count 加 10000 结束
11377

这个就是因为线程切换导致的原子性问题。

Java 代码中的 count++ ，至少需要三条 CPU 指令：

指令 1：把变量 count 从内存加载到 CPU 的寄存器
指令 2：在寄存器中执行 count + 1 操作
指令 3：+1 后的结果写入 CPU 缓存或内存

即使是单核的 CPU，当线程 1 执行到指令 1 时发生线程切换，线程 2 从内存中读取 count 变量，此时线程 1 和线程 2 中的 count 变量值是相等，都执行完指令 2 和指令 3，写入的 count 的值是相同的。从结果上看，两个线程都进行了 count++，但是 count 的值只增加了 1。

指令执行与线程切换

3、编译器指令重排优化，带来了有序性问题

有序性：程序按照代码执行的先后顺序

看下面这段代码，复现指令重排带来的有序性问题。

package constxiong.concurrency.a014;

import java.util.HashMap;
import java.util.HashSet;
import java.util.Map;
import java.util.Set;

/**
 * 测试有序性问题
 * @author ConstXiong
 */
public class TestOrderliness {
    
    static int x;//静态变量 x
    static int y;//静态变量 y

    public static void main(String[] args) throws InterruptedException {
        Set<String> valueSet = new HashSet<String>();//记录出现的结果的情况
        Map<String, Integer> valueMap = new HashMap<String, Integer>();//存储结果的键值对
        
        //循环 1000 万次，记录可能出现的 v1 和 v2 的情况
        for (int i = 0; i < 10000000; i++) {
            //给 x y 赋值为 0
            x = 0; 
            y = 0; 
            valueMap.clear();//清除之前记录的键值对
            Thread t1 = new Thread(() -> {
                int v1 = y;//将 y 赋值给 v1 ----> Step1
                x = 1;//设置 x 为 1  ----> Step2
                valueMap.put("v1", v1);//v1 值存入 valueMap 中  ----> Step3
            }) ;
            
            Thread t2 = new Thread(() -> {
                int v2 = x;//将 x 赋值给 v2  ----> Step4
                y = 1;//设置 y 为 1  ----> Step5
                valueMap.put("v2", v2);//v2 值存入 valueMap 中  ----> Step6
            });
            
            //启动线程 t1 t2
            t1.start();
            t2.start();
            //等待线程 t1 t2 执行完成
            t1.join();
            t2.join();
            
            //利用 Set 记录并打印 v1 和 v2 可能出现的不同结果
            valueSet.add("(v1=" + valueMap.get("v1") + ",v2=" + valueMap.get("v2") + ")");
            System.out.println(valueSet);
        }
    }
    
}

打印结果出现四种情况：

v1=0,v2=0 的执行顺序是 Step1 和 Step 4 先执行

v1=1,v2=0 的执行顺序是 Step5 先于 Step1 执行

v1=0,v2=1 的执行顺序是 Step2 先于 Step4 执行

v1=1,v2=1 出现的概率极低，就是因为 CPU 指令重排序造成的。Step2 被优化到 Step1 前，Step5 被优化到 Step4 前，至少需要成立一个。

指令重排，可能会发生在两个没有相互依赖关系之间的指令。

来一道刷了进BAT的面试题？

posted @ 2019-10-16 16:36 ConstXiong 阅读(783) 评论(0) 收藏举报

刷新页面返回顶部

ConstXiong

程序员

导致并发程序出问题的根本原因是什么？

来一道刷了进BAT的面试题？

公告