java多线程:线程间通信——生产者消费者模型
一、背景 && 定义
多线程环境下,只要有并发问题,就要保证数据的安全性,一般指的是通过 synchronized 来进行同步。
另一个问题是,多个线程之间如何协作呢?
我们看一个仓库出货问题(更具体一些,快餐店直接放好炸货的架子,不过每次只放一份)
- 假设仓库中只能存放一件商品,生产者将生产出来的产品放入仓库,消费者将仓库中产品取走进行消费;
- 如果仓库中没有商品,那么生产者将产品放入仓库,否则停止生产并等待,直到仓库中的产品被消费者取走为止;
- 如果仓库中放有产品,消费者可快速取走并消费,否则停止消费并等待,直到仓库中再次放入产品为止。
这其实就是一个线程同步问题。生产者和消费者共享同一个资源,并且生产者和消费者之间互相依赖,互为条件。
如果一个快餐店:
先点单,餐出来之后再收钱。这种模式叫BIO-阻塞IO模式。
如果一个快餐店:
先收钱,收完钱消费者在旁边等。这种就是生产者-消费者模式。
这类问题里,同步的候只有 synchronized 是不够的,因为他虽然能解决资源的共享问题,实现资源的同步更新,但是无法在不同线程之间进行消息传递(通信)。
所以只有我们之前所说的加锁和排队是不够的,还要有通知。
定义:
生产者和消费者在同一时间段内共用同一个存储空间,生产者往存储空间中添加产品,消费者从存储空间中取走产品,当存储空间为空时,消费者阻塞,当存储空间满时,生产者阻塞。
为了解决双方能力不等而等待的问题,引入对应的解决方案。生产者消费者模型是一种并发协作模型。
二、解决方式介绍
2.1 管程法
- 生产者:负责生产数据的模块(模块可能是方法、对象、线程、进程);
- 消费者:负责处理数据的模块(模块可能是方法、对象、线程、进程);
- 缓冲区:消费者不能直接使用生产者的数据,它们之间有个“缓冲区”(缓冲区一般是队列)。
生产者和消费者都是通过缓冲区进行数据的 放 和 拿 。
这样的话,一来可以避免旱的旱死,涝的涝死的问题:不管哪一方过快或者过慢,缓冲区始终有一部分数据;二来能够达到生产者和消费者的解耦,不再直接通信,从而提高效率。
因为容器相当于一个输送商品的管道,所以成为管程法。
2.2 信号灯法
采用类似红灯绿灯的模式,决定车走还是人走。
- 管程法使用容器的状态来控制,数据在容器中;
- 而信号灯法只是用信号来给生产者和消费者提醒,他们的交互数据并不由信号灯来保管。
2.3 Object类
jdk 里面 Object 类老早就有提供解决线程间通信的问题的方法:
- wait():表示线程一直等待,直到其他线程通知(也就是调用了notify或者notifyAll方法),与sleep不同,会释放锁;
- wait(long timeout):指定时间;
- notify():唤醒一个处于等待状态的线程;
- notifyAll():唤醒同一个对象上所有调用 wait() 方法的线程,优先级别高的线程优先调度。
这几个方法都是在同步方法或者同步代码块中使用,否则会抛出异常。
(很多面试题问 Java 的 Object 类有哪些方法,都是希望得到关于这块的答案,引到多线程)
三、管程法实现
管程法实现的四个角色:
- 生产者和消费者都是多线程;
- 中间的缓冲区应该是一个容器,并且需要的是一个并发容器,java.util.concurrent包里面已经提供了;
- 资源,也就是各个角色来回交换的商品。
利用 Object 类的几个方法,来实现管程法,以下是代码示例:
/**
* 协作模型:生产者消费者模型实现:管程法
*/
public class Cooperation1 {
public static void main(String[] args) {
Container container = new Container();
new Producer(container).start();
new Consumer(container).start();
}
}
/**
* 生产者
*/
class Producer extends Thread{
Container container;
public Producer(Container container){
this.container = container;
}
@Override
public void run() {
//生产过程
for (int i=0; i<10; i++){
System.out.println("生产第 " + i + " 个馒头");
container.push(new Hamburger(i));
}
}
}
/**
* 消费者
*/
class Consumer extends Thread{
Container container;
public Consumer(Container container){
this.container = container;
}
@Override
public void run() {
//消费过程
for (int i=0; i<10; i++){
System.out.println("消费第 " + container.pop().id + " 个馒头");
}
}
}
/**
* 缓冲区,操作商品,并和生产者、消费者交互
*/
class Container{
Hamburger[] food = new Hamburger[10];
private int count = 0;
//存储:生产
public synchronized void push(Hamburger hamburger){
if (count == food.length){
try {
this.wait();//阻塞,但是等待消费者通知后会解除
} catch (InterruptedException e) {
e.printStackTrace();
}
}
food[count++] = hamburger;
this.notifyAll();//说明存在数据了,通知消费者消费
}
//获取:消费
public synchronized Hamburger pop(){
if (count ==0 ){
try {
this.wait();//阻塞,直到生产者通知后会解除
} catch (InterruptedException e) {
e.printStackTrace();
}
}
Hamburger ans = food[--count];
this.notifyAll();//存在空余空间了,通知生产者生产
return ans;
}
}
/**
* 商品
*/
class Hamburger{
int id;
public Hamburger(int id) {
this.id = id;
}
}
其中的核心有这么几点:
- 容器相当于一个栈,是后进先出的;
- 容器的两个方法对于资源的操作,一个和生产者交互,一个和消费者交互,除了 synchronized 修饰,因为两个方法是互斥的,所以利用 wait 和 notify 方法使他们完成阻塞和解除阻塞;
- 生产者和容器交互,添加数据;
- 消费者和容器交互,删除数据。
前面关于 线程的阻塞问题,生命周期里的阻塞,完整的可能情况,就包含这里的阻塞情况:
四、信号灯法实现
和上一种通过容器的容量让线程之间互相通知的方法不同,信号灯法没有用数据缓存的方式,而是用信号灯来指示双方,对方是否已经准备好了要和你通信。
下面是一个 电视直播和观众的代码示例,通过信号灯,通知演员和观众直播,确保演员在演的时候,让观众来看。
/**
* 协作模型:生产者消费者实现:信号灯法
*/
public class Cooperation2 {
public static void main(String[] args) {
TV tv = new TV();
new Actor(tv).start();
new Fans(tv).start();
}
}
/**
* 生产者:演员
*/
class Actor extends Thread{
TV tv;
public Actor(TV tv){
this.tv = tv;
}
@Override
public void run() {
for (int i=0; i<10; i++){
if (i%2 == 0){
this.tv.play("节目 " + i);
}else{
this.tv.play("广告 " + i);
}
}
}
}
/**
* 消费者:观众
*/
class Fans extends Thread{
TV tv;
public Fans(TV tv){
this.tv = tv;
}
@Override
public void run() {
for (int i=0; i<10; i++){
tv.watch();
}
}
}
/**
* 共同资源:电视直播
*/
class TV{
String voice;
//信号灯,如果为真则演员准备,观众等待
//如果为假,则观众就位,演员等待
boolean flag = true;
//表演方法:针对生产者
public synchronized void play(String voice){
//演员等待
if (!flag){
try {
this.wait();
} catch (InterruptedException e) {
e.printStackTrace();
}
}
this.voice = voice;
System.out.println("表演 "+voice +" ing");
//唤醒观众
this.notifyAll();
this.flag = !flag;
}
//观看方法:针对消费者
public synchronized void watch(){
//观众等待
if (flag){
try {
this.wait();
} catch (InterruptedException e) {
e.printStackTrace();
}
}
System.out.println("观看 " + voice +" ing");
this.notifyAll();
this.flag = !flag;
}
}
可以看到,相比管程法的核心区别是:
TV 没有用一个容器存储数据,只是通过生产者是否生产,来决定信号灯的标志,以此通知消费者来消费。
显然这两种实现方法,有不同的适用场景,那就是决定于生产者消费者是否有数据沟通。
五、虚假唤醒问题
对于上面的代码,一个生产者和一个消费者的模型,程序是没有问题的。
但是如果说我们把生产者和消费者线程的个数都增加的话,就会出现问题,可能会出现多生产(一个消费者买到的时候得到的number>1)、或出现逻辑错误(一个消费者买的时候number<0),这个执行结果碰运气, 可能不会出现,也可能出现很离谱的结果。
为什么呢?
因为 Object 类的 wait 和 notifyall 方法,可能会产生虚假唤醒的情况。所谓虚假唤醒,就是我们采用 if 进行的这种写法:
- 如果只有两个线程,那么一个 wait ,等待另一个唤醒它,就能够完成生产者和消费者的协作;
- 但如果是再多个线程,当某一个线程执行完毕,调用 notifyAll:
- 本来我们希望的是只唤醒对立面的角色;
- 但是 notifyall 唤醒了所有的线程;
- 结合 if 的 bug, 被唤醒之后,if 已经判断过了,因此会跳出去,导致好几个生产者都执行++,或者好几个消费者都执行--。
- 这就叫虚假唤醒,本质就是 if 值判断一次,进入分支体之后就失效。
解决方案,其实就是官方文档给出的使用 wait 和 notify 时候伴随条件的推荐写法,那就是使用 while 循环 而不是 if。
这样无论多少个线程,能保证生产者和消费者问题的安全性。