Java Concurrent
本文节选自 Effective Java by Joshua Bloch 和 Concurrent Programming in Java by Doug Lea.
1.1 概述
多线程程序设计比单线程程序设计要困难的多,所以,如果一个库中的类能够帮助你从低层的多线程程序设计中解脱出来,那么一定要使用这个类。比如java.util.Timer。另外,util.concurrent包是一个高层次的线程工具集合。在 Java 语言中,协调对共享字段的访问的传统方法是使用同步,确保完成对共享字段的所有访问。对于现代 JVM 而言,无竞争的同步现在非常便宜。以下是两个简单例子:
- public class SynchronizedCounter
- {
- private int value;
- public synchronized int getValue() { return value; }
- public synchronized int increment() { return ++value; }
- public synchronized int decrement() { return --value; }
- }
- public class SynchronizedMutex
- {
- private Thread curOwner = null;
- public synchronized void acquire() throws InterruptedException
- {
- if (Thread.interrupted()) throw new InterruptedException();
- while (curOwner != null)
- {
- wait();
- }
- curOwner = Thread.currentThread();
- }
- public synchronized void release()
- {
- if (curOwner == Thread.currentThread())
- {
- curOwner = null;
- notify();
- }
- else
- {
- throw new IllegalStateException("not owner of mutex");
- }
- }
- }
1.2 synchronized关键字
1.2.1 语义
synchronized关键字不属于方法签名的一部分。所以当子类覆盖父类的方法时,synchronized修饰符不会被继承。因此接口中的方法不能被声明为synchronized。同样地,构造函数也不能被声明为synchronized(尽管构造函数内的程序块可以被声明为synchronized)。
在java语言中,锁是递归(recursive)的,锁操作是基于“每线程”而不是“每调用”,如果调用线程已经拥有了锁,当他试图再次获得锁的时候,即使此时该锁保护的数据上有另一个完全不相关的操作正在进行,它也会成功。本质上讲,这时候该锁没有起到应有的作用。递归锁简化了多线程面向对象程序的设计和构造,但是可能会把活性失败(liveness failure)变成安全性失败(safety failure)。锁的申请和释放操作是在使用synchronized关键字的时候根据内部的获得-释放协议来使用的。所有的锁都是块结构。当进入synchronized方法或块的时候得到锁,退出的时候释放锁,即使因为异常也会释放锁。
1.2.2作为类成员函数的修饰符
当把synchronized关键字作为类成员函数的修饰符时,这时候锁定的是被调用同步方法的对象, 例如
- public synchronized int increment() { return ++value; }
实际上等同于
- public int increment()
- {
- synchronized(this)
- {
- return ++value;
- }
- }
子类和父类的方法使用同一个锁,但是内部类的锁和它的外部类无关,然而,一个非静态的内部类可以锁住它的外部类,例如:
- synchronized(OuterClass.this){ /* body */ }
1.2.3作为类静态函数的修饰符
锁住一个对象并不代表不可访问这个对象或者其任何父类的静态数据。可以通过synchronized static方法或块来实现静态数据的保护。当把synchronized关键字作为类静态函数的修饰符时,这时候锁定的是被调用同步方法的类对象,和每个类相关的静态锁与任何其它类的锁都没有关系,包括它的父类。如果想在子类中增加一个静态同步方法来达到保护父类的静态数据的目的是不可能的,应该用明确同步块版本。以下是synchronized关键字作为类静态函数的修饰符的例子:
- public synchronized static int increment() { return ++value; }
实际上等同于
- public int increment()
- {
- synchronized(SynchronizedCounter.class)
- {
- return ++value;
- }
- }
1.2.4同步块
当有一个明确的对象作为同步锁的时候, 就可以使用同步块。另外, 如果只是想同步一段代码,那么可以创建一个特殊的对象来充当锁
- public void foo(Object obj)
- {
- synchronized(obj)
- {
- // do something
- }
- }
1.3 原子数据的同步
java语言保证读或写一个变量是原子(atomic)的,除非这个变量的类型是long或double.换句话说,读入一个非long或double类型的变量,可以保证返回值一定是某个线程保存在该变量中的,即使多个线程在没有同步的时候并发地修改这个变量,也是如此。
虽然原子性保证了一个线程在读写数据的时候,不会看到一个随机的数值,但是它并不保证一个线程写入的值对于另外一个线程是可见的。java的内存模型决定,为了在线程之间可靠地通信,以及为了互斥访问,对原子数据的读写进行同步是需要的。考虑下边的序列号生成程序:
- private static int nextSerialNumber = 0;
- public static int generateSerialNumber()
- {
- return nextSerialNumber++;
- }
这个程序的意图是保证每次调用generateSerialNumber都会返回一个不同的序列号,然而,如果没有同步,这个方法并不能正确的工作。递增操作符(++)既要读nextSerialNumber域,也要写nextSerialNumber域,所以它不是原子的。读和写相互独立的操作。因此,多个并发的线程可能会看到nextSerialNumber有相同的值,因而返回相同的序列号。此外,一个线程重复地调用generateSerialNumber,获得从0到n的一系列序列号之后,另外一个线程调用generateSerialNumber并获得一个序列号是0,这是有可能发生的。如果没有同步机制,第二个线程可能根本看不到第一个线程所作的改变。
1.4 监控机制
正如每个Object都有一个锁, 每个Object也有一个等待集合(wait set),它有wait、notify、notifyAll和Thread.interrupt方法来操作。同时拥有锁和等待集合的实体,通常被成为监视器(monitor)。每个Object的等待集合是由JVM维护的。等待集合一直存放着那些因为调用对象的wait方法而被阻塞的线程。由于等待集合和锁之间的交互机制,只有获得目标对象的同步锁时,才可以调用它的wait、notify和notifyAll方法。这种要求通常无法靠编译来检查,如果条件不能满足,那么在运行的时候调用以上方法就会导致其抛出IllegalMonitorStateException。
wait 方法被调用后,会执行如下操作
- 如果当前线程已经被中断,那么该方法立刻退出,然后抛出一个InterruptedException异常。否则线程会被阻塞。
- JVM把该线程放入目标对象内部且无法访问的等待集合中。
- 目标对象的同步锁被释放,但是这个线程锁拥有的其他锁依然会被这个线程保留着。当线程重新恢复质执行时,它会重新获得目标对象的同步锁
notify方法被调用后,会执行如下操作
- 如果存在的话,JVM会从目标对象内部的等待集合中任意移除一个线程T。如果等待集合中的线程数大于1,那么哪个线程被选中完全是随机的。
- T必须重新获得目标对象的同步锁,这必然导致它将会被阻塞到调用Thead.notify的线程释放该同步锁。如果其他线程在T获得此锁之前就获得它,那么T就要一直被阻塞下去。
- T从执行wait的那点恢复执行。
notifyAll方法被调用后的操作和notify类似,不同的只是等待集合中所有的线程(同时)都要执行那些操作。然而等待集合中的线程必须要在竞争到目标对象的同步锁之后,才能继续执行。
interrupt。如果对一个因为调用了wait方法而被挂起的对象调用Thread.interrupt方法,那么这个方法的执行机制就和notify类似,只是在重新获得对象锁后,该方法就会抛出InterruptedException异常,并且该线程的中断状态被置为false。
对于Object.wait()方法,它一定是在一个同步区域中被调用,而且该同步区域锁住了被调用的对象。下边是使用Object.wait()方法的标准模式:
- synchronized(obj)
- {
- while( condition checking)
- {
- obj.wait();
- }
- …// Other operations
- }
总是要使用wait循环模式来调用wait方法,永远不要在循环的外边调用wait方法。循环的作用在于在等待的前、后都能测试条件。在等待之前测试条件,如果条件成立的话则跳过等待,这对于确保程序的活性(liveness)是必要的。如果条件已经成立,而且在线程等待之前notify(或者notifyAll)方法已经被调用过,那么无法保证该线程将总会从等待中醒过来。在等待之后测试条件,如果条件不成立的话则继续等待,这对于确保程序的安全性(safety)是必要的。当条件不成立的时候,如果线程继续执行,那么可能破坏被锁保护的约束关系。当条件不成立的时候,有以下一些理由可以使一个线程醒过来:
- 从一个线程调用notify方法的时刻起,到等待线程被唤醒的时刻之间,另一个线程得到了锁,并且改变了被保护的状态。
- 条件没有成立,但是另外一个线程可能意外或者恶意地调用了notify方法。在公有对象上调用wait方法,这其实是将自己暴露在危险的境地中。因为任何持有这个对象引用的线程都可以调用该对象的notify方法。
- 在没有被通知的情况下等待线程也可能被唤醒。这被称为“伪唤醒(spurious wakeup)”。虽然《Java语言规范(The Java Language Specification )》并没有提到这种可能,但是许多JVM实现都使用了具有伪唤醒功能的线程设施,尽管用的很少。
与此相关的一个问题是,为了唤醒正在等待的线程,到底应该使用notify方法还是应该使用notifyAll方法。假设所有的wait调用都是在循环的内部,那么使用notifyAll方法是一个合理而保守的做法。它总会产生正确的结果,它可以保证会唤醒所有需要被唤醒的线程。当然,这样也会唤醒其它一些线程,但是这不会影响程序的正确性。这些线程醒来之后会检查等待条件,发现条件不满足,就会继续等待。使用notifyAll方法的另外一个优点在于可以避免来自不相关线程的意外或者恶意等待。否则的话,这样的等待可能会“吞掉”一个关键的通知,使真正的接收线程无限地等待下去。关于使用notifyAll方法的一个不足在于,虽然使用notifyAll方法不会影响程序的正确性,但是会影响程序的性能。
1.5 死锁
尽管完全同步的原子操作很安全,但是线程可能却因此失去了活性(liveness)。死锁(dead lock)是在两个或多个线程都有权限访问两个或多个对象,并且每个线程都在已经得到一个锁的情况下等待其它线程已经得到的锁。假设线程A持有的对象X的锁,并且正在试图获得对象Y的锁,同时,线程B已经拥有的对象Y的锁,并在试图获得对象X的锁。因此没有哪个线程能够执行进一步的操作,死锁就产生了。例如:
- public class Cell {
- private long value;
- public Cell(long value) {
- this.value = value;
- }
- public synchronized long getValue() {
- return value;
- }
- public synchronized void setValue(long value) {
- this.value = value;
- }
- public synchronized void swap(Cell other) {
- long t = getValue();
- long v = other.getValue();
- setValue(v);
- other.setValue(t);
- }
- public static void main(String args[]) throws Exception {
- //
- final Cell c1 = new Cell(100);
- final Cell c2 = new Cell(200);
- //
- Thread t1 = new Thread(new Runnable() {
- public void run() {
- long count = 0;
- try {
- while(true) {
- c1.swap(c2);
- count++;
- if(count % 100 == 0) {
- System.out.println("thread1's current progress: " + count);
- }
- }
- } catch (Exception e) {
- e.printStackTrace();
- }
- }
- });
- t1.setName("thread1");
- //
- Thread t2 = new Thread(new Runnable() {
- public void run() {
- long count = 0;
- try {
- while(true) {
- c2.swap(c1);
- count++;
- if(count % 100 == 0) {
- System.out.println("thread2's current progress: " + count);
- }
- }
- } catch (Exception e) {
- e.printStackTrace();
- }
- }
- });
- t2.setName("thread2");
- //
- t1.start();
- t2.start();
- t1.join();
- t2.join();
- }
- }
如果按照下面的时序执行时序,就会导致死锁:
线程A | 线程B |
进入a.swap(b)时获得a的锁 | |
在执行t = getValue()时,顺利获得a的锁(因为已经持有) | 进入b.swap(a)时获得b的锁 |
执行v = other.getValue()时,由于需要b的锁而处于等待的状态 | 在执行t = getValue()时,顺利获得b的锁 |
执行v = other.getValue()时,由于需要a的锁而处于等待状态 |
以上的代码执行一段时间后可能就会发生死锁。此时可以通过thread dump获得线程的栈跟踪信息。在Unix平台下可以通过向JVM发送SIGQUIT信号(kill -3)获得thread dump,在Windows平台下则通过Ctrl+Break。以上代码在死锁时的thread dump如下:
Found one Java-level deadlock:
=============================
"thread2":
waiting to lock monitor 0x0003e664 (object 0x230c3f40, a Cell),
which is held by "thread1"
"thread1":
waiting to lock monitor 0x0003e6a4 (object 0x230c3f50, a Cell),
which is held by "thread2"
Java stack information for the threads listed above:
===================================================
"thread2":
at Cell.getValue(Cell.java:18)
- waiting to lock <0x230c3f40> (a Cell)
at Cell.swap(Cell.java:27)
- locked <0x230c3f50> (a Cell)
at Cell$2.run(Cell.java:65)
at java.lang.Thread.run(Unknown Source)
"thread1":
at Cell.setValue(Cell.java:22)
- waiting to lock <0x230c3f50> (a Cell)
at Cell.swap(Cell.java:29)
- locked <0x230c3f40> (a Cell)
at Cell$1.run(Cell.java:46)
at java.lang.Thread.run(Unknown Source)
Found 1 deadlock.
为了避免死锁的危险,在一个同步的方法或者代码块中,永远不要放弃对客户的控制。换句话说,在一个被同步的区域内部,不要调用一个可被改写的公有或受保护的方法。从包含该同步区域的类的角度来看,这样的一个方法是一个外来者(alien)。这个类不知道该方法会做什么事情,也控制不了它。假设客户的方法创建另一个线程,再回调到这个类中。然后,新建的线程试图获取原线程所拥有的那把锁,这样就会导致新建的线程被阻塞。如果创建该线程的方法正在等待这个线程完成任务,则会导致死锁。
另外一种比较简单的避免死锁的独占技术是顺序化资源(resource ordering),它的思想就是把一个嵌套的synchronized方法或块中使用的对象和一个数字标签关联起来。如果同步操作是根据对象标签的最小优先(least first)的原则,那么刚才介绍的例子的情况就不会发生。也就是说,如果线程A和线程B都按照相同的顺序获得锁,就可以避免死锁的发生。对于数字标签的选择,可以使用System.identityHashCode的返回值,尽管没有什么机制可以保证identityHashCode的惟一性,但是在实际运行的系统中,这个方法的惟一性在很大程度上得到了保证。swap的一个更好的实现如下:
- public void swap(Cell other)
- {
- if(this == other) return; // Alias check
- else if(System.identityHashCode(this) < System.identityHashCode(other))
- {
- this.doSwap(other);
- }
- else
- {
- other.doSwap(this);
- }
- }
- private synchronized void doSwap(Cell Other)
- {
- long t = getValue();
- long v = other.getValue();
- setValue(v);
- other.setValue(t);
- }
1.6 避免过多的同步
1.6.1是否需要同步
过多的同步可能会导致性能降低、死锁,甚至不确定行为。通常,在同步区域内应该做尽可能少的工作。同步区域之外被调用的外来方法被称为“开放调用(open call)”。除了可以避免死锁之外,开放调用还可以极大地增加并发性。
考虑StringBuffer类和BufferedInputStream类,这些类都是线程安全(thread-safe)的,但是它们往往被用于单个线程中,所以它们所做的锁操作往往是不必要的,虽然同步的开销自java平台早期开始就一直在下降,但是它永远也不会消失。一个给定的类是否应该执行内部同步并不总是很清楚,下面是一些指导性的原则。
如果你正在编写的类主要被用于同步环境中,同时也被用于不要求同步的环境中,那么一个合理的方法是,同时提供同步版本和和未同步版本。这也正是Collections Framework采用的方法。还有,java.util.Random也是采用这一种做法是提供一个包装类(wrapper class),它实现一个描述该类的接口,同时在将方法调用转发给内部对象中对应的方法之前执行适当的同步操作。种方法。第二种方法适用于那些不是被设计用来扩展或者重新实现的类,它提供一个未同步的类和一个子类,在子类中包含一些被同步的方法,它们依次调用到超类中对应的方法上。
关于是否对一个用于存取成员变量的方法进行同步,需要考虑两点:合法性和陈旧性。如果成员变量不总是合法的,那么可以的选择是:
- 同步所有存取方法
- 确保用户在得到非法值的时候能得到通知
- 省略存取方法。在并发程序中,对象的属性可以被异步修改,客户通过某行代码得到的值可能在下一行代码中就改变了。因此需要仔细评估存取方法存在的必要性。
如果成员变量的值总是合法的,但是不能是陈旧数据,那么可以的选择是:
- 把成员变量定义为volatile,并去掉存取方法的同步。
1.6.2 分解同步和分解锁
另外一种增加程序并发性的方法是分解同步,如果一个类的行为可以分解为互相独立、互不干扰或者不冲突的子部分,那么就值得用细粒度的辅助对象来重新构造类。普遍的原则是,把类的内部同步操作分得越细,在大多数情况下,它的活性就越高。但是这一点是以更加复杂和潜在的错误为代价的。例如:
- public class Shape
- {
- public synchronized vodi adjustLocation(){ /*Long time operation*/ }
- public synchronized vodi adjustDimensions(){ /*Long time operation*/ }
- }
我们假设adjustLocation不处理维度信息,adjustDimensions不处理位置信息,那么可以考虑把维度和位置信息分解到两个类中, 例如:
- public class Shape
- {
- private final Location location = new Location();
- private final Dimensions dimensions = new Dimensions();
- public void adjustLocation(){ location.adjustLocation(); }
- public void adjustDimensions(){ dimensions.adjustDimensions(); }
- }
- public class Location
- {
- public synchronized void adjustLocation(){ /*Long time operation*/ }
- }
- public class Dimensions
- {
- public synchronized void adjustDimensions(){ /*Long time operation*/ }
- }
如果你不能或者不想分解类,则可以分解每个子功能相关的同步锁。例如
- public class Shape
- {
- private final Object locationLock = new Object();
- private final Object dimensionsLock = new Object();
- public void adjustLocation()
- {
- synchronized(locationLock)
- {
- /*Long time operation*/
- }
- }
- public void adjustDimensions()
- {
- synchronized(dimensionsLock)
- {
- /*Long time operation*/
- }
- }
- }
1.6.3 冲突集合
设想有一个Inventory类,它有store和retrieve方法来存取对象。以下的例子中使用了Hashtable来演示,虽然这种完全同步的Hashtable允许Inventory类的实现无需考虑底层的实现细节。但是,我们仍然想store和retrieve方法添加一些语义上的约束,如下:
- retrieve操作不应该和store操作并发执行。
- 两个或者两个以上的retrieve方法不应该同时执行。
- 两个或者两个以上的store方法可以同时执行。
以下的非正规符号描述了冲突集合,即不能并发的方法对的集合.
{(store, retrieve), (retrieve, retrieve)}
基于冲突集合的类可以使用before/after这种模式,即基本操作被那些维护者独占关系的代码所环绕。首先,对于每个方法,定义一个计数变量,用以表示该方法是否在执行中。其次,把每个基本操作都隔离入非公共方法中。最后,编写那些基本操作的公共版本,即在那些基本操作的前后添加上before/after的控制。以下是个示例代码:
- public class Inventory
- {
- protected final Hashtable items = new Hashtable();
- protected final Hashtable suppliers = new Hashtable();
- protected int storing = 0;
- protected int retrieving = 0;
- public void store(String desc, Object item, String supplier)
- throws InterruptedException
- {
- synchronized(this)
- {
- while(retrieving != 0)
- {
- wait();
- ++storing;
- }
- }
- try
- {
- doStore(desc, item, supplier);
- }
- finally
- {
- synchronized(this)
- {
- if(--storing == 0)
- {
- notifyAll();
- }
- }
- }
- }
- public Object retrieve(String desc)
- throws InterruptedException
- {
- synchronized(this)
- {
- while(storing != 0 || retrieving != 0)
- {
- wait();
- ++retrieving;
- }
- }
- try
- {
- return doRetrieve(desc);
- }
- finally
- {
- synchronized(this)
- {
- if(--retrieving == 0)
- {
- notifyAll();
- }
- }
- }
- }
- protected void doStore(String desc, Object item, String supplier)
- {
- items.put(desc, item);
- suppliers.put(supplier, desc);
- }
- protected Object doRetrieve(String desc)
- {
- Object x = items.get(desc);
- if(x != null)
- {
- items.remove(desc);
- }
- return x;
- }
- }
接下来考虑一个更复杂的例子,一个读出者和写入者模型,与Inventroy不同,读出者和写入者策略不仅应用于特定方法,而是控制所有具有读出和写入语义的方法。假设我们需要进行有目的的锁定(intention lock),比如,要求按照write,read,write,read,write的顺序等。这时候我们需要考虑的有以下几点:
- 如果当前已经存在一个或者多个活动(执行中)的读出者,而且有一个写入者正在等待的时候,一个新的读出者是否能否立即加入?如果答案是肯定的话,那么不断增加的读出者将会使写入者无法执行;如果答案为否,那么读出者的吞吐量就会下降。
- 如果某些读出者与写入者同时在等待一个活动的写入者完成操作,那么你的处理策略会偏向读出者还是写入者?先到者优先?随意?轮流?
虽然以上策略没有明确的答案,但是一些标准的解决方案和相关的实现还是存在的,以下一个通用的实现,使用了模板类和before/after这种模式,其子类版本不需要做过多的修改。而且可以通过让allowReader和allowWriter方法中的谓词依赖与这个值,来调整控制策略。以下是示例代码:
- public abstract class ReadWrite
- {
- protected int activeReaders = 0;
- protected int activeWriters = 0;
- protected int waitingReaders = 0;
- protected int waitingWriters = 0;
- protected abstract void doRead();
- protected abstract void doWrite();
- public void read() throws InterruptedException
- {
- beforeRead();
- try { doRead(); }
- finally { afterRead(); }
- }
- public void write() throws InterruptedException
- {
- beforeWrite();
- try { doWrite(); }
- finally { afterWrite(); }
- }
- protected boolean allowReader()
- {
- return waitingWriters == 0 && activeWriters == 0;
- }
- protected boolean allowWriter()
- {
- return activeReaders == 0 && activeWriters == 0;
- }
- protected synchronized void beforeRead() throws InterruptedException
- {
- ++waitingReaders;
- while(!allowReader())
- {
- try { wait(); }
- catch(InterruptedException ie)
- {
- --waitingReaders;
- throw ie;
- }
- }
- --waitingReaders;
- ++activeReaders;
- }
- protected synchronized void afterRead()
- {
- --activeReaders;
- notifyAll();
- }
- protected synchronized void beforeWrite() throws InterruptedException
- {
- ++waitingWriters;
- while(!allowWriter())
- {
- try { wait(); }
- catch(InterruptedException ie)
- {
- --waitingWriters;
- throw ie;
- }
- }
- --waitingWriters;
- ++activeWriters;
- }
- protected synchronized void afterWrite()
- {
- --activeWriters;
- notifyAll();
- }
- }
1.7 使用锁工具
1.7.1 synchronized 的限制
内部的synchronized方法和块可以满足很多基于锁的应用,但是它有以下限制:
- 如果某个线程试图获得锁,而这个锁已经被其他线程持有,那么没有办法回退,也没有办法在等待一段时间后放弃等待,或者在某个中断之后取消获取锁的企图,这些使得线程很难从活性问题中恢复。
- 没有办法改变锁的语义形式,例如重入性、读何写保护或者公平性等方面。
- 没有同步的访问控制,任何一个方法都可以对其可访问的对象执行synchronized(obj)操作,这样导致由于所需要的锁已经被占用而引起拒绝服务的问题。
- 方法和块内的同步,使得只能够够对严格的块结构使用锁。例如:不能在一个方法中获得锁,而在另外一个方法中释放锁。
1.7.2 util.concurrent工具包
util.concurrent工具包是Doug Lea在基本的Java同步工具(synchronization tools)之上,编写的高质量、高效率、语义上准确的线程控制结构工具包。下面简要介绍几个接口和实现。
1.7.2.1 ReentrantLock
ReentrantLock具有与内部锁相同的互斥、重入性和内存可见性的保证,它必须被显式地释放。ReentrantLock是可中断的、可定时的,非块结构锁。在Java5中,ReentrantLock的性能要远远高于内部锁。在Java6中,由于管理内部锁的算法采用了类似于 ReentrantLock使用的算法,因此内部锁和ReentrantLock之间的性能差别不大。
ReentrantLock的构造函数提供了两种公平性选择:创建非公平锁(默认)或者公平锁。在公平锁中,如果锁已被其它线程占有,那么请求线程会加入到等待队列中,并按顺序获得锁;在非公平锁中,当请求锁的时候,如果锁的状态是可用,那么请求线程可以直接获得锁,而不管等待队列中是否有线程已经在等待该锁。公平锁的代价是更多的挂起和重新开始线程的性能开销。在多数情况下,非公平锁的性能高于公平锁。Java内部锁也没有提供确定的公平性保证, Java语言规范也没有要求JVM公平地实现内部锁,因此ReentrantLock并没有减少锁的公平性。下面是关于ReentrantLock的一个例子:
- import java.util.concurrent.locks.Condition;
- import java.util.concurrent.locks.Lock;
- import java.util.concurrent.locks.ReentrantLock;
- public class BoundedBuffer<T> {
- //
- private int head;
- private int tail;
- private int count;
- private final T buffer[];
- //
- private final Lock lock = new ReentrantLock();
- private final Condition notEmpty = lock.newCondition();
- private final Condition notFull = lock.newCondition();
- @SuppressWarnings("unchecked")
- public BoundedBuffer(int capacity) {
- this.buffer = (T[]) new Object[capacity];
- }
- public T take() throws InterruptedException {
- lock.lock();
- try {
- while(isEmpty()) {
- notEmpty.await();
- }
- T t = doTake();
- notFull.signal();
- return t;
- } finally {
- lock.unlock();
- }
- }
- public void put(T t) throws InterruptedException {
- lock.lock();
- try {
- while(isFull()) {
- notFull.await();
- }
- doPut(t);
- notEmpty.signal();
- } finally {
- lock.unlock();
- }
- }
- private boolean isEmpty() {
- return count == 0;
- }
- private boolean isFull() {
- return count == buffer.length;
- }
- private T doTake() {
- T t = buffer[head];
- buffer[head] = null;
- if(++head == buffer.length) {
- head = 0;
- }
- --count;
- return t;
- }
- private void doPut(T t) {
- buffer[tail] = t;
- if(++tail == buffer.length) {
- tail = 0;
- }
- ++count;
- }
- }
1.7.2.2 Mutex
一个Mutex类(互斥独占锁mutual exclusion lock)的所写可以定义为
- public class Mutex implemets Sync
- {
- public void acquire() throws InterruptedException;
- public void release();
- public boolean attempt(long msec) throws InterruptedException;
- }
acquire和同步块的入口操作相似,release和同步块的释放锁操作相似。attempt操作只有在规定的时间内得到锁才返回true。0是合法的,这表明如果得不到锁的话则不需要等待。和内建的同步机制不同的是,如果当前的线程在试图获得锁的过程中被中断,acquire和attempt方法会抛出InterruptedException异常,这一点增加了使用的复杂性,但是提供了编写响应良好的健壮代码的来处理取消操作的机制。和synchronized方法或块不同的是,标准的Mutex类不能重入。如果锁已经被执行acquire的线程持有,如果这个线程继续调用acquire,那么它会被阻塞。ReentrantLock是可重入的锁。
1.7.2.3 Semaphore
信号量(Semaphore) 是并发控制中的经典构件。同其他工具类一样,它们也遵守获得-释放协议。从概念上说,一个信号量维护着一组在构造方法中初始化了的许可证。如果必要的话,每次acquire操作都会阻塞直到有一个许可证可用,然后占用这个许可证。attempt方法执行类似的操作,但是它可以在超时的时候失败并退出。每一次release都会添加一个许可证。不过事实上并没有使用真实的许可证对象,信号量只需要知道当前可用的许可证的数量并执行相关的操作即可。Mutex可以看成许可数是1的Semaphore。下面是关于信号量的一个典型例子:
- public class SyncQueue implements Queue
- {
- private final Queue mQueue;
- private final int mCapacity;
- private final Semaphore mSemProducer;
- private final Semaphore mSemConsumer;
- public SyncQueue(Queue queue)
- {
- this(queue, Integer.MAX_VALUE);
- }
- public SyncQueue(Queue queue, int capacity)
- {
- mQueue = queue;
- mCapacity = capacity;
- mSemProducer = new Semaphore(capacity);
- mSemConsumer = new Semaphore(0);
- }
- public Object get()
- {
- // Accquire consumer's semaphore
- try
- {
- mSemConsumer.acquire();
- }
- catch(InterruptedException ie)
- {
- Thread.currentThread().interrupt();
- return null;
- }
- // Get the item
- Object item = null;
- synchronized(mQueue)
- {
- item = mQueue.get();
- }
- //
- mSemProducer.release();
- return item;
- }
- public boolean put(Object item)
- {
- // Precondition checking
- if(item == null)
- {
- return false;
- }
- // Accquire producer's semaphore
- try
- {
- mSemProducer.acquire();
- }
- catch(InterruptedException ie)
- {
- Thread.currentThread().interrupt();
- return false;
- }
- // Add the item
- synchronized(mQueue)
- {
- mQueue.put(item);
- }
- // Release consumer's semaphore
- mSemConsumer.release();
- return true;
- }
- }
1.7.2.4 Latch
闭锁(latch)是指那些一旦获得某个值就再不变化的变量或者条件。二元闭锁变量或者条件(通常就被成为闭锁)的值只能改变一次,即从其初始化状态到其最终状态。和闭锁相关的并发控制技术封装在Latch类中,并遵守通用的获得-释放协议。但是它的语义为:一个release操作将使得所有之前或者之后的acquire操作都恢复执行。
闭锁的扩展之一就是倒数计数器(countdown),其acquire操作在release操作执行了固定的次数,而不仅仅是一次后恢复执行。闭锁,倒数计数器以及建立在他们基础之上的简单工具类可以被用于处理一下这些条件的响应操作。
- 完成指示器。例如,强制某些线程直到某些操作执行完毕后才能继续执行。
- 定时阀值。例如,在某个时期触发一组线程。
- 事件指示。例如,触发那些只有收到特定报文或者特定按钮被按下后才能继续的操作。
- 错误指示。例如,触发在全局性的关闭人去执行时才可以运行的一组线程
1.7.2.5 Barrier
Barrier能够阻塞一组线程,其与闭锁的区别在于:闭锁等待的是事件,barrier等待的是线程。CyclicBarrier允许给定数量的线程多次集中在一个barrier point。当某个线程调用await方法时会被阻塞,当所有的线程都调用await方法时,barrier被突破,所有的线程都可以继续执行,barrier也被reset以备下一次使用。如果await调用超时,或者阻塞中的线程被中断,那么barrier就认为是失败的,所有未完成的await调用都通过BrokenBarrierException终止。如果await调用成功,那么它返回一个唯一的到达索引号。CyclicBarrier也允许你向构造函数中传递一个Runnable型的barrier action,当成功通过barrier的时候会被执行。下面是关于CyclicBarrier的一个例子:
- import java.util.concurrent.BrokenBarrierException;
- import java.util.concurrent.CountDownLatch;
- import java.util.concurrent.CyclicBarrier;
- public class Solver {
- //
- private final String[][] data;
- private final CyclicBarrier barrier;
- private final CountDownLatch latch;
- public Solver(String[][] data) {
- this.data = data;
- this.barrier = new CyclicBarrier(data.length, new BarrierAction());
- this.latch = new CountDownLatch(data.length);
- }
- public void start() {
- //
- for (int i = 0; i < data.length; ++i) {
- new Thread(new Worker("worker" + i, this.data[i])).start();
- }
- //
- try {
- latch.await();
- } catch (InterruptedException e) {
- e.printStackTrace();
- }
- }
- public static void main(String args[]) {
- String[][] data = new String[][]{{"a1", "a2", "a3"}, {"b1", "b2", "b3"}, {"c1", "c2", "c3"}};
- Solver solver = new Solver(data);
- solver.start();
- }
- private class BarrierAction implements Runnable {
- public void run() {
- System.out.println(Thread.currentThread().getName() + " is processing barrier action");
- }
- }
- private class Worker implements Runnable {
- //
- private String name;
- private String[] row;
- Worker(String name, String[] row) {
- this.name = name;
- this.row = row;
- }
- public void run() {
- for(int i = 0; i < row.length; i++) {
- System.out.println(name + " is processing row[" + i +"]" + row[i]);
- try {
- barrier.await();
- } catch (InterruptedException ex) {
- break;
- } catch (BrokenBarrierException ex) {
- break;
- }
- }
- //
- latch.countDown();
- }
- }
- }
1.8 并发处理实践
假设你设计了一个集合类,现在想提供一个多线程环境下的遍历方法。最于这个设计问题一般有三种解决方法:同步聚集操作、索引化遍历和版本化迭代变量,每种方法都有设计的利弊。
1.8.1 同步聚集操作
一种安全使用枚举的方法就是吧作用于每个元素的操作抽取出来,这样可以把它作为synchronized applyToAll方法的参数(比如C/C++中的函数指针(function pointer),java中的接口或者闭包(colsure))。例如:
- public interface Procedure
- {
- void apply(Object obj);
- }
- public class Vector
- {
- public syncronized void applyToAll(Procedure p)
- {
- for(int i = 0; i < size; i++)
- {
- p.apply(data[i]);
- }
- }
- }
这种方法消除了在遍历过程中其它线程是否增加或者减少集合元素可能带来的干扰,但是代价是拥有集合的锁的时间太长。
1.8.2 索引化遍历和客户端锁
这种遍历策略是要求客户端使用索引的访问方法来遍历,例如:
- for(int i = 0; i < v.size(); i++)
- {
- System.out.println(v.get(i));
- }
size(), get(int)方法都是同步的,但是为了处理有细锁类度产生的潜在冲突,比如像v.size()方法可能成功,但是之后,另一个线程可能删除了最后一个元素,如果这时调用v.get(i)可能就会出错。解决这个问题的一个办法就是使用客户端锁,来保证大小检查和访问的原子性。
这种方法使用起来比较灵活,但是是在破会封装为代价的前提下,而且正确与否依赖于对Vector内部实现的了解程度。
1.8.3 版本化迭代变量
这用遍历方法是涉及的集合类支持失败即放弃的迭代变量,如果在遍历的过程中集合元素被修改,迭代操作就会抛出一个异常。实现这种策略的最简单的方法就是维护一个迭代操作的版本号,这个版本号在每次更新集合时都会增长。每当迭代变量访问下一个元素的时候,都会先看一下这个版本号,如果它已经改变了,则抛出一个异常。这个版本号应该足够大,使得在一次遍历的过程中版本号不会循环。一般来讲,整形(int)就足够了。
Java语言集合框架中的java.util.Iterator使用的就是这用策略。ConcurrentModificationException经常说明了在线程之间存在无计划而且不希望看到的交互,然而这些问题的修正仅靠异常处理代码往往是不够的。对于集合类来说,版本化迭代变量还是一个比较好的选择,部分因为可以在这些迭代化变量之上使用聚合遍历或客户端锁。
如果你喜欢本文, 请长按二维码,关注公众号 分布式编程.
作者:分布式编程
出处:https://zthinker.com/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。