Java中wait()方法为什么要放在同步块中?(lost wake-up 问题)
问题起源
事情得从一个多线程编程里面臭名昭著的问题"Lost wake-up problem"说起。
这个问题并不是说只在Java语言中会出现,而是会在所有的多线程环境下出现。
假如我们有两个线程,一个消费者线程,一个生产者线程。生产者线程的任务可以简化成将count加一,而后唤醒消费者;消费者则是将count减一,而后在减到0的时候陷入睡眠,代码如下:
生产者伪代码:
count+1;
notify();
消费者伪代码:
while(count<=0) wait() count--
熟悉多线程的朋友一眼就能够看出来,这里面有问题。什么问题呢?
生产者是两个步骤:
- count+1;
- notify();
消费者也是两个步骤:
- 检查count值;
- 睡眠或者减一;
这就是所谓的lost wake up问题。(丢掉了唤醒线程的那条信息)
那么怎么解决这个问题呢?
现在我们应该就能够看到,问题的根源在于,消费者在检查count到调用wait()之间,count就可能被改掉了。这就是一种很常见的竞态条件。很自然的想法是,让消费者和生产者竞争一把锁,竞争到了的,才能够修改count的值。
于是生产者的代码是:
tryLock() count+1 notify() releaseLock()
消费者的代码是:
tryLock() while(count <= 0) wait() count-1 releaseLock
注意的是,我这里将两者的两个操作都放进去了同步块中。现在来思考一个问题,生产者代码这样修改行不行?
答案是,这样改毫无卵用,依旧会出现lost wake up问题,而且和无锁的表现是一样的。
终极答案
所以,我们可以总结到,为了避免出现这种lost wake up问题,在这种模型之下,总应该将我们的代码放进去的同步块中。
Java强制我们的wait()/notify()调用必须要在一个同步块中(不然的话会报错),就是不想让我们在不经意间出现这种lost wake up问题。
不仅仅是这两个方法,包括java.util.concurrent.locks.Condition的await()/signal()也必须要在同步块中:
private ReentrantLock lock = new ReentrantLock();
private Condition condition = lock.newCondition();
@Test
public void test() {
try {
condition.signal();
} catch (Exception e) {
e.printStackTrace();
}
}
确的来说,即便是我们自己在实现自己的锁机制的时候,也应该要确保类似于wait()和notify()这种调用,要在同步块内,防止使用者出现lost wake up问题。
Java的这种检测是很严格的。它要求的是,一定要处于相同锁对象的同步块中。举例当不同锁对象的时候来说:
private Object obj = new Object(); private Object anotherObj = new Object(); @Test public void produce() { synchronized (obj) { try { anotherObj.notify(); } catch (Exception e) { e.printStackTrace(); } }
}
这样是没有什么卵用的。一样出现IllegalMonitorStateException。
所以大家知道该怎么做了吧?哈哈