多线程系列(五) -死锁分析及解决办法介绍

一、简介

在之前的文章中，我们介绍了synchronized同步锁关键字的作用以及相关的用法，它能够保证同一时刻最多只有一个线程执行修饰的代码段，以实现线程安全执行的效果。

但是如果过度的使用synchronized等方式进行加锁，程序可能会出现死锁现象。

那什么是死锁呢？它有什么危害？

我们知道被synchronized修饰的代码，当一个线程持有一个锁，其它线程尝试去获取这个锁未获取到时，那么其它线程会进入阻塞状态，直到线程释放锁才能再次拥有获取锁的条件。假如线程 A 持有锁 L 并且想获取锁 R，线程 B 持有锁 R 并且想获取锁 L，那么这两个线程将会永久等待下去，这种情况就是最简单的死锁现象。

如果程序出现了死锁，会给系统功能带来非常严重的问题，轻则导致程序响应时间变长，系统吞吐量变小；重则导致应用中的某一个功能直接失去响应能力无法提供服务，因此我们应该及时发现并避规这些问题。

当然发生死锁的软件应用，不仅限于 Java 程序，还有数据库等，不同的是：数据库系统中设计了死锁的检测以及从死锁中恢复的机制，数据库如果检测到一组事务中发生了死锁，将选择一个牺牲者并放弃这个事务。

而 Java 虚拟机解决死锁问题并没有数据库那么强大，在 Java 程序中，采用synchronized加锁的代码如果发生死锁，两个线程就不能再使用了，并且这两个线程所在的同步代码／代码块也无法再运行了，除非杀掉服务，然后重启服务！

在实际的软件项目开发过程中，死锁其实是编程设计上的 bug，问题也比较隐晦，即使通过压力测试也不一定能找到程序上的死锁问题。死锁的出现，往往是在高负载的情况下产生，这种场景下比较难定位。

二、死锁复现

下面我们先来看一个比较经典的产生死锁示例代码。

public class DeadLock {

    private final Object right = new Object();

    private final Object left = new Object();

    /**
     * 加锁顺序从left -> right
     */
    public void leftRight() throws Exception {
        synchronized (left) {
            // 模拟某个业务操作耗时
            Thread.sleep(1000);
            synchronized (right) {
                System.out.println(Thread.currentThread().getName() + " left -> right lock.");
            }
        }
    }

    /**
     * 加锁顺序right -> left
     */
    public void rightLeft() throws Exception {
        synchronized (right) {
            // 模拟某个业务操作耗时
            Thread.sleep(1000);
            synchronized (left) {
                System.out.println(Thread.currentThread().getName() + " right -> left lock.");
            }
        }
    }
}

public class MyThreadA extends Thread {


    private DeadLock deadLock;

    public MyThreadA(DeadLock deadLock) {
        this.deadLock = deadLock;
    }

    @Override
    public void run() {
        try {
            deadLock.leftRight();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

public class MyThreadB extends Thread {


    private DeadLock deadLock;

    public MyThreadB(DeadLock deadLock) {
        this.deadLock = deadLock;
    }

    @Override
    public void run() {
        try {
            deadLock.rightLeft();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

public class MyThreadTest {

    public static void main(String[] args) {
        DeadLock deadLock = new DeadLock();

        MyThreadA threadA = new MyThreadA(deadLock);
        MyThreadB threadB = new MyThreadB(deadLock);
        threadA.start();
        threadB.start();
    }
}

运行测试类观察控制台，你会发现服务一直在运行，什么都没有输出，并且无法关闭，因为程序已经死锁了！

发生这个现象的原因，其实也很简单。

1.线程 A 启动之后，先获取了left对象锁，然后紧接着尝试获取right对象锁，因为right对象锁被其它线程占有，只能进入阻塞状态
2.线程 B 启动之后，先获取了right对象锁，然后紧接着尝试获取left对象锁，因为left对象锁被其它线程占有，只能进入阻塞状态
3.两个线程互相等待对方释放锁，程序进入永久等待状态，因此都无法进入打印方法体

如何定位死锁问题呢？

我们可以通过 Java 自带的 jps 和 jstack 工具，查看 java 进程 id 和相关的线程堆栈信息。

定位过程如下！

2.1、通过 jps 获得当前 Java 虚拟机进程的 pid

左边的是当前 Java 虚拟机进程 ID，后边是进程名称，其中MyThreadTest就是我们当前运行的测试类服务。

2.2、通过 jstack 查看进程中的线程信息

在 jstack 后面输入对应的 java 进程 ID，然后回车即可查询到进程中的线程情况，前面的部分，可以很清晰的看到，两个线程都处于阻塞状态，等待获取对应的锁。

因为线程的信息比较多，直接滑倒最底部，可以看到 JVM 给出的死锁报告信息。

遇到这种情况，只能强制终止服务才能解除死锁！

三、避免死锁的方式

上面我们复现了死锁的发生，总结下来你会发现死锁的产生，总共有四个共同特点：

1.互斥使用，即当资源被一个线程占用时，别的线程不能使用
2.不可抢占，资源请求者不能强制从资源占有者手中抢夺资源，资源只能由占有者主动释放
3.请求和保持，当资源请求者在请求其他资源的同时保持对原有资源的占有
4.循环等待，多个线程存在环路的锁依赖关系而永远等待下去，例如 T1 占有 T2 的资源，T2 占有 T3 的资源，T3 占有 T1 的资源，这种情况可能会形成一个等待环路

这四个特点是死锁产生的必要条件，只要系统发生死锁，这些条件必然成立，只要能破坏其中一条即可让死锁消失，当然条件一是基础，不能被破坏。

理解了死锁的原因，尤其是产生死锁的四个必要条件，就可以最大可能地避免产生死锁和解除死锁。

在软件编程中，我们如何避免死锁呢？

关于死锁的避免，主要有以下几种方式：