jvm高级特性(6)(线程的种类,调度,状态,安全程度,实现安全的方法,同步种类,锁优化,锁种类)
JVM高级特性与实践(十三):线程实现 与 Java线程调度
一. 线程的实现
线程其实是比进程更轻量级的调度执行单位。 线程的引入,可以把一个检查的资源分配和执行调度分开,各个线程既可以共享资源(内存地址、文件I/O等),又可以独立调度(线程是CPU调度的基本单位)。
线程实现 还是 Java线程实现?
主流的操作系统都有提供线程实现,Java语言则提供了不同硬件和操作系统平台下对线程操作的统一处理,
每个已经执行start() 且还未结束的 java.lang.Thread 类的实例就代表了一个线程。
Thread类与大部分Java API有显著的差别,因为它所有的关键方法都声明 Native的。
在Java API 中,一个Native 方法往往意味着这个方法没有使用或无法使用平台无关的手段。
正因如此,此小节标题作为“线程实现”而不是“Java线程实现”。
接下来介绍实现线程的3种主要方式:
1,使用内核线程实现
2,使用用户线程实现
3,使用用户线程加轻量级进程混合实现
1. 使用内核线程(Kernel-Level Thread)实现
(1)定义
内核线程(Kernel-Level Thread):
就是直接由操作系统内核(下称内核)支持的线程,这种线程由内核来完成线程切换,内核通过操纵调度器对线程进行调度,并负责将线程的任务映射到各个处理器上。
多线程内核(Multi-Threads Kernel):
每个内核线程可以视为内核的一个分身,这样操作系统就有能力同时处理多个事情,支持多线程的内核就叫多线程内核。
(2)轻量级进程(Light Weight Process)
程序一般不会直接去使用内核线程,而是去使用内核线程的一种高级接口——轻量级进程:
轻量级进程就是我们通常意义上讲的线程。
(3)轻量级进程与内核线程之间关系
由于每个轻量级线程都由一个内核线程支持,因此只有先支持内核线程,才能有轻量级进程。
这种轻量级进程与内核线程间1:1 的关系称为一对一的线程模型,如下图所示
(4)轻量级进程的局限性
由于内核线程的支持,每个轻量级进程都成为一个独立的调度单元,即使有一个轻量级进程在系统调用中阻塞了,也不会影响整个进程继续工作,
但是轻量级进程有它的局限性:
1,由于是基于内核线程实现的,所以各种线程操作,如创建,析构及同步,都需要进行系统调用, 而系统调用的代价相对较高,需要在用户态和内核态中来回切换。
2,每个轻量级进程都需要有一个内存线程的支持,因此轻量级进程要消耗一定的内核资源(如内核线程的栈空间),因此一个系统支持轻量级进程的数量是有限的。
2. 使用用户线程(User Thread)实现
(1)定义
从广义而言,一个线程只要不是内核线程,就可认为是用户线程。
因此,轻量级进程也属于用户线程,但轻量级进程实现始终建立在内核线程上,许多操作都要系统调用,效率受到限制。
从狭义而言, 用户线程指的是完全建立在用户空间的线程库上,系统内核不能感知线程存在的实现。
用户线程的建立、同步、销毁和调度完全在用户态中完成,不需要内核帮助。
(2)进程与用户进程关系
如果处理得当,此线程不需要切换到内核态,因此操作时非常快速和低耗能的,也可支持大规模线程数量,部分高性能数据库中的多线程就是由用户线程实现的。
这种进程与用户线程之间的关系如下:
(3)用户线程的优劣势
优势:不需要系统内核支援。
劣势:没有系统内核支援,所有的线程操作都需要用户程序自行处理。
线程的创建、切换和调度都需要考虑,由于操作系统只把处理器资源分配到进程,那“阻塞如何处理”诸如此类问题解决会很困难。
(4)用户线程已被放弃
因而使用用户线程实现的程序一般比较复杂,除了以前在不支持多线程的操作系统中有使用,现在已被抛弃。
3. 使用用户线程加轻量级进程混合实现
(1)介绍
线程除了依赖内核线程实现和完全由用户程序自行实现外,还有一种混合实现,在该实现方式下,既存在用户线程,也存在轻量级进程。
(2)优势
用户线程还是完全建立在用户空间中:
因此用户线程的创建,切换,析构等操作依然廉价,并且可以支持大规模的用户线程并发。
操作系统提供支持的轻量级进程则作为用户线程和内核线程之间的桥梁:
这样可以使用内核提供的线程调度功能及处理器映射,并且用户线程的系统调用要通过轻量级线程来完成,大大降低了整个进程被完全阻塞的风险.
(3)用户线程与轻量级进程关系
在这种混合模式中,用户线程与轻量级进程的数量比是不定的,即为 N:M 的关系,
如下图所示, 这种就是多对多的线程模型
二. Java 线程调度 和 状态转换
1. Java线程调度
(1)定义
线程调度是指系统为线程分配处理器使用权的过程。
主要调度方式有:协同式线程调度 和 抢占式线程调度
(2)协同式线程调度(Cooperative Threads-Scheduling)
定义
在此多线程系统中,线程的执行时间由线程本身控制,线程把自己的工作执行完之后,要主动通知系统切换到另外一个线程上。
优劣势
好处:实现简单,由于线程要把自己事情干完才会进行线程切换,切换操作对线程自己是可知的,所以没什么线程同步问题。
坏处:线程执行时间不可控,如果一个线程编写有问题,一直不告知系统进行线程切换,那么程序就会一直阻塞在那里。
(3)抢占式线程调度(Preemptive Threads-Scheduling)
定义
在此多线程系统中,每个线程将由系统来分配时间,线程的切换不由线程本身决定(Java中,Thread.yield() 可以让出执行时间,但是线程无法获取执行时间)。
优势
线程执行时间是系统可控的,也不会出现一个线程导致整个进程阻塞的问题。
Java使用的线程调度方法就是这个。
(4)Java线程优先级
虽然Java 线程调度是系统自动完成的, 但我们还是可以建议系统给某些线程多分配一点执行时间,另外一些线程则可以少分配一点——这项操作可以通过设置线程优先级来完成。
Java语言一共设置了10个级别的优先级,在两个线程同时处于 Ready状态,优先级越高的线程越容易被系统选择执行。
不过线程优先级并不是太靠谱,
原因是因为Java的线程是通过映射到系统的原生线程上来实现的,
所以线程调度最终还是取决于 操作系统,虽然现在很多os 都提供了线程优先级,但不见得和 能与 java线程的优先级一一对应。
如 Solaris中有 2^32 种优先级,而windows只有7种 。
(5)Java 线程优先级与Windows线程优先级对应关系
(6)优先级可能会被系统自行改变
上文说到的“Java线程优先级并不是太靠谱”,
不仅仅是在说一些平台上不同的优先级实际会变得相同这一点,还有其他情况让我们不能太依赖优先级:优先级可能会被系统自行改变。
例如:在Windows 中存在一个称为 “优先级推进器”的功能,作用是 当系统发现一个线程执行得特别勤奋的话,可能会越过线程优先级去为它分配执行时间。
因此,我们不能在程序中通过优先级来完全准备判断一组状态都为Ready的线程将会先执行哪个。
2. 状态转换
(1)Java语言中线程的6种状态
Java语言定义了6种状态,在任意一个时间点,一个线程只能有且其中一种状态,分别如下:
1,新建(New):创建后尚未启动的线程处于这个状态。
2,运行(Runnable): Runable包括了os 线程状态中的 Running 和 Ready,也就是处于此状态的线程有可能正在执行,也有可能正在等待着CPU为它分配执行时间。
3,无限期等待(Waiting):处于这种状态的线程不会被分配CPU执行时间,它们要等待被其他线程显式的唤醒。
以下方法会让线程陷入无限期的等待状态:
3.1,没有设置Timeout参数的Object.wait()方法;
3.2,没有设置Timeout参数的 Thread.join() 方法;
3.3,LockSupport.park() 方法;
4,限期等待(Timed Waiting):处于这种状态的线程也不会被分配CPU 执行时间,不过无需等待被其他线程显式唤醒,在一定时间之后,它们会由系统自动唤醒。
以下方法会让线程进入限期等待状态:
4.1,Thread.sleep() 方法;
4.2,设置了Timeout参数的Object.wait()方法;
4.3,设置了Timeout参数的 Thread.join() 方法;
4.4,LockSupport.parkNanos() 方法;
4.5,LockSupport.parkUntil() 方法;
5,阻塞(Blocked):线程被阻塞了,
“阻塞状态”与“等待状态”的区别是:
“阻塞状态”在等待着获取到一个排他锁,这个事件将在另外一个线程放弃这个锁的时候发生;而“等待状态”则是在等待一段时间,或者唤醒动作的发生。
在程序等待进入同步区域的时候,线程将进入这种状态。
6,结束(Terminated):已经终止线程的线程状态,线程已经结束执行。
(2)状态转换关系图
上述5种状态在遇到特定事件发生时会互相转换,它们的转换关系如下:
三. 线程安全
“线程安全”这个概念没有一个太准确的定义,大致含义:
google搜索:如果一个对象可以安全地被多个线程同时使用,那它就是线程安全的。
《Java Concurrency In Practice》记录:当多个线程访问一个对象时,如果不用考虑这些线程在运行环境下的调度和交替执行,也不需要进行额外的同步,
或者在调用方法进行任何其他的协调操作,调用这个对象的行为都可以获得正确的结果,那这个对象是线程安全的。
线程安全的代码的一个共同特征:
代码本身封装了所有必要的正确性保障手段(如互斥同步),令调用者无须关心多线程的问题,更无须自己采取任何措施来保证多线程的正确调用。
接下来讨论Java语言中的具体实现。后续所讨论的“线程安全”限定在多个线程之间存在共享数据的前提。
按照“线程安全”的安全程度依次递减,可分为:
不可变、绝对线程安全、相对线程安全、线程兼容和线程对立,
1. 不可变
(1)定义
不可变对象一定是线程安全的,无论是对象的方法实现还是方法的调用者,都不需要采取任何的线程安全保障措施。
1,如果共享数据是一个基本数据类型,那么只要在定义时使用 final 关键字修饰它就可以保证它是不可变的。
2,如果共享的是一个对象,需要保证对象行为不会对其状态产生任何影响。
例如 java.lang.String类的对象:
它是一个典型的不可变对象,调用它的substring()
, replace()
, concat()
这些方法都不会影响它原来的值,只会返回一个新构造的字符串对象。
(2)保证对象行为途径
途径有多种,其中最简单的就是把对象中带有状态的变量都声明为final,这样在构造函数之后,它就是不可变的。
(3)实例讲解
例如java.lang.Integer 构造函数所示的,将value定义为final 来保障状态不变:
2. 绝对线程安全
(1)定义
一个类要达到“不管运行环境如何,调用者都不需要任何额外的同步措施”通常需要付出很大。
在Java API中标注自己是线程安全的类,大多数都不是绝对的线程安全。
(2)实例讲解
例如 java.util.Vector 是一个线程安全的容器,因为它的add()
方法、get()
方法、size()
方法 这些方法都是被 synchronized修饰的,尽管效率低下,但确实是安全的。
可以即使如此并不意味着调用它的时候不需要同步手段了,对Vector的测试如下:
public class VectorTest { private static Vector<Integer> vector = new Vector<>(); public static void main(String[] args) { while(true) { for (int i = 0; i < 100; i++) { vector.add(i); } Thread removeThread = new Thread(new Runnable() { @Override public void run() { for (int i = 0; i < vector.size(); i++) { vector.remove(i); } } }); Thread printThread = new Thread(new Runnable() { @Override public void run() { for (int i = 0; i < vector.size(); i++) { System.out.println(vector.get(i)); } } }); removeThread.start(); printThread.start(); // 不要同时产生过多的线程,否则会导致os 假死 while(Thread.activeCount() > 20); } } }
结果:
结果分析
原书解说会抛出异常,但博主实际运行却没有抛出异常(不太理解,日后补充,暂时按照书本逻辑继续分析)。
抛出异常的原因:
因为如果另一个线程恰好在错误的时间里删除了一个元素,导致序号i 已经不再可用的话,再用i 访问数组就会抛出一个 ArrayIndexOutOfBoundsException。
改善代码
如果要保证这段代码能够正确执行下去,修改后的代码为:
Thread removeThread = new Thread(new Runnable() { @Override public void run() { synchronized (vector) { for (int i = 0; i < vector.size(); i++) { vector.remove(i); } } } }); Thread printThread = new Thread(new Runnable() { @Override public void run() { synchronized (vector) { for (int i = 0; i < vector.size(); i++) { System.out.println((vector.get(i))); } } } });
3. 相对线程安全
(1)定义
相对线程的安全就是通常意义上所讲的线程安全,它需要保证对这个对象单独操作是线程安全的。
开发人员在调用的时候不需要做额外保障措施,但是对于一些特定顺序连续调用,就需要在调用端使用额外的同步手段来保证调用正确性。
(2)实例讲解
上述 Vector测试就是相对线程安全的案例。
4. 线程兼容
(1)定义
线程兼容是指对象本身并不是线程安全的,但是可以通过在调用端正确地使用同步手段来保证对象在并发环境中可以安全地使用。
平常所说的一个类不是线程安全,绝大多数指这种情况。
(2)实例讲解
Java API 大部分类属于线程兼容的,如之前的Vector和 HashTable相对应的集合类ArrayList 和 HashMap等。
5. 线程对立
(1)定义:
指无论调用端是否采取了同步措施,都无法在多线程环境中并发使用的代码。
注意:由于java语言天生就具备多线程特性,线程对立这种排斥多线程的代码是很少出现的,而且通常是有害的,应当尽量避免。
(2)实例讲解
例如Thread类的suspend()
和 resume()
方法,如果有两个线程同时持有一个线程对象,一个尝试去中断线程,另一个尝试去恢复线程,
如果并发进行的话,无论调用时是否进行了同步,目标线程都是存在死锁风险的。正由于这个原因,suspend和result方法已经被JDK废弃了了。
四. 线程安全的实现方法
以上了解线程安全之后,下面就是如何实现线程安全,其中虚拟机提供的同步和锁机制起到了重要的作用。
1. 互斥同步(Mutual Exclusion & Synchronization)
(1)定义
互斥同步是常见的并发正确性保障手段。
同步:是指在多个线程并发访问共享数据时,保证共享数据在同一个时刻被一个线程使用。
互斥:互斥是实现同步的一种手段。
临界区,互斥量和信号量都是主要的互斥实现方式。因此,在这4个字里面,互斥是因,同步是果;互斥是方法,同步是目的。
(2)synchronized关键字
最基本的互斥同步手段就是 synchronized关键字,synchronized关键字经过编译之后,会在同步块的前后分别形成 monitorenter 和 monitorexit 这个两个字节码指令,
这两个字节码都需要一个 reference类型的参数来指明要锁定和解锁的对象。
1,如果java程序中的synchronized明确指定了对象参数,那就是这个对象的reference。
2,如果没有明确指定,那就根据 synchronized修饰的实例方法还是类方法,去取对应的对象实例或Class 对象来作为锁对象。
(3)monitorenter和monitorexit 指令执行
根据虚拟机规范的要求:
在执行monitorenter指令时,如果这个对象没有锁定或当前线程已经拥有了那个对象的锁,锁的计数器加1,
相应的,在执行 monitorexit 指令时会将锁计数器减1;当计数器为0时,锁就被释放了。
其中有两点需要注意:
1,synchronized同步块对同一条线程来说是可重入的, 不会出现自己把自己锁死的问题。
2,同步块在已进入的线程执行完之前,会阻塞后面其他线程的进入。
(4)重入锁(ReentrantLock)
除了synchronized之外,还可以使用 java.util.concurrent 包中的重入锁来实现同步。
synchronized 和 ReentrantLock 的区别:
一个表现为 API 层面的互斥锁(lock()
和 unlock()
方法配合 try/finally 语句块来完成),另一个表现为 原生语法层面的互斥锁。
(5)ReentrantLock新增的高级功能
主要有3项:等待可中断,可实现公平锁, 以及锁可以绑定多个条件。
等待可中断:指当持有锁的线程长期不释放锁的时候,正在等待的线程可以选择放弃等待,改为处理其他事情,可中断特性对处理执行时间非常长的同步块很有帮助;
公平锁:指多个线程在等待同一个锁时,必须按照申请锁的时间顺序来依次获得锁;
锁绑定多个条件:指一个 ReentrantLock对象可以同时绑定多个 Condition对象,
而在 synchronized中,锁对象的wait() 和 notify() 或 notifyAll() 方法可以实现一个隐含的条件,
如果要和多于一个的条件关联的时候,就不得不额外地添加一个锁,而ReentrantLock 则无需这样做,只需要多次调用 newCondition() 方法即可。
(6)synchronized 和 ReentrantLock 性能的分析
若需要使用上述功能,ReentrantLock 是很好的选择,若基于性能考虑,
做了以下测试Brian Goetz对这两种锁在JDK1.5 与单核处理器,以及JDK1.5与双Xeon处理器环境下的吞吐量对比实验。
结果分析:
多线程环境下 synchronized的吞吐量下降得非常严重,而 ReentrantLock 则能基本保持在同一个比较稳定的水平上。
与其说ReentrantLock性能好,还不如说 synchronized还有非常大的优化余地。
虚拟机在未来的性能改进中肯定也会更加偏向于原生的 synchronized,所以还是提倡在 synchronized能实现需求的情况下,优先考虑使用 synchronized 来进行同步。
2. 非阻塞同步
互斥同步最主要的问题就是进行线程阻塞和唤醒所带来的性能问题,称为阻塞同步。
(1)定义
基于冲突检测的乐观并发策略,通俗的说,
就是先进行操作,如果没有其他线程争用共享数据,那操作就成功了。
如果共享数据有争用,产生了冲突,那就再采用其他的补偿措施,这种乐观的并发策略的许多实现都不需要把线程挂起,因此这种同步操作称为 非阻塞同步。
(2)硬件指令集
为什么使用乐观并发策略需要“硬件指令集的发展”才能进行呢?因为我们需要操作和冲突检测这两个步骤具备原子性,靠什么来保证呢?
是硬件,它保证一个从语义上看起来需要多次操作的行为只通过一次处理器指令就能完成,
这类指令常用的有:
1,测试并设置(Test-and-Set); 2,获取并增加(Fetch-and-Increment); 3,交换(Swap); 4,比较并交换(Compare-and-Swap,下文简称 CAS); 5,加载链接/ 条件存储(Load-Linked/Store-Conditional,下文简称 LL/SC);
(3)CAS 操作避免阻塞同步
如何使用CAS 操作来避免阻塞同步,看个例子:
/** * Atomic变量自增运算测试 * * @author zzm */ public class AtomicTest { public static AtomicInteger race = new AtomicInteger(0); public static void increase() { race.incrementAndGet(); } private static final int THREADS_COUNT = 20; public static void main(String[] args) throws Exception { Thread[] threads = new Thread[THREADS_COUNT]; for (int i = 0; i < THREADS_COUNT; i++) { threads[i] = new Thread(new Runnable() { @Override public void run() { for (int i = 0; i < 10000; i++) { increase(); } } }); threads[i].start(); } while (Thread.activeCount() > 1) Thread.yield(); System.out.println(race); } }
运行结果
200000
分析
使用AtomicInteger代替 int后,程序输出了正确结果,一切都要归功于incrementAndGet()
方法的原子性,实现简单如下:
/** * Atomically increment by one the current value. * @return the updated value */ public final int incrementAndGet() { for (;;) { int current = get(); int next = current + 1; if (compareAndSet(current, next)) return next; } }
incrementAndGet()分析:
此方法在一个无限循环中,不断尝试将一个比当前值大 1 的新值赋值给自己。
如果失败则说明在执行“获取=设置”操作的时候值已经有了修改,于是再次循环进行下一次操作,知道设置成功为止。
(4)CAS操作(比较并交换操作)的ABA问题
如果一个变量V初次读取的时候是A值,并且在准备赋值的时候检查到它仍然是A值,那我们就说它的值没有被其他线程改变过了吗?
如果在这段期间它的值曾经被改为了B,之后又改回了A,那CAS操作就会误认为它从来没有被改变过,这个漏洞称为 CAS操作的 ABA问题。
(5)解决方法
J.U.C 包为了解决这个问题,提供了一个带有标记的原子引用类“AtomicStampedReference”,它可以通过控制变量值的版本来保证CAS的正确性。
不过目前来说这个类比较鸡肋, 大部分情况下 ABA问题 不会影响程序并发的正确性,如果需要解决ABA问题,改用传统的互斥同步可能会比原子类更高效。
3. 无同步方案
如果一个方法本来就不涉及共享数据,那它自然就无须任何同步措施去保证正确性,因此会有一些代码天生就是线程安全的,下面介绍其中的两类。
(1)可重入代码(Reentrant Code)
也叫作纯代码,可以在代码执行的任何时刻中断它,转而去执行另外一段代码,而在控制权返回后,原来的程序不会出现任何错误。
1,所有的可重入代码都是线程安全的;
2,如何判断代码是否具备可重入性:
如果一个方法,它的返回结果是可以预测的,只要输入了相同的数据,就都能返回相同的结果,那它就满足可重入性的要求,当然也就是线程安全的。
(2)线程本地存储(Thread Local Storage)
如果一段代码中所需要的数据必须与其他代码共享,那就看看这些共享数据的代码是否能够保证在同一线程中执行?
如果能保证,我们就可以把共享数据的可见范围限制在同一个线程内,这样,无需同步也可以保证线程间不出现数据争用问题。
五. 锁优化
高效并发是从 JDK 1.5 到 JDK 1.6的一个重要改进,HotSpot虚拟机开发团队在此版本实现了各种锁优化,都是为了在线程之间高效共享数据,提供程序执行能力
1. 自旋锁与自适应自旋
前文在讨论互斥同步时,提到互斥同步对性能最大的影响是阻塞的实现,挂起线程和恢复线程的操作都需要转入内核态中完成,
而许多应用上共享数据的锁定状态只会持续很短的一段时间,为了这段时间去挂起和恢复线程很不值得。
(1)定义
若物理机有一个以上的处理器,能让两个或以上的线程同时执行,
就可以让后面请求锁的线程“稍等”,但不放弃处理器的执行时间,看看持有锁的线程是否很快就会释放锁。
为了让线程等待,我们只需让线程执行一个忙循环(自旋),这项技术就是所谓的自旋锁。
(2)自旋等待时间限度
自旋等待不能代替阻塞,它本身虽避免了线程切换的开销,但仍要占用处理器时间。
因此时间占用越短,效果越好,反之自旋的线程只会白白消耗处理器资源,带来性能浪费。
自旋等待的时间必须要有一定的限度, 如果自旋超过了限定的次数仍然没有成功获得锁,就应当使用传统的方式去挂起线程了。
自旋次数的默认值是10,用户可以用参数 -XX:PreBlockSpin 来更改。
(3)自适应自旋锁
JDK 1.6 中引入了自适应的自旋锁。自适应意味着自旋的时间不再固定了,而是由前一次在同一个锁上的自旋时间及锁的拥有者的状态来决定:
1,如果在同一个锁对象上,自旋等待刚刚成功获得过锁,并且持有锁的线程正在运行中,
那么虚拟机就会认为这次自旋也很有可能再次成功,进而它将允许自旋等待持续相对更长的时间,比如100个循环。
(ps:线程刚才获得过锁,那么这次等待,就会自旋更长时间)
2,如果对于某个锁,自旋很少成功获得过, 那在以后要获取这个锁时将可能省略掉自旋过程,以避免浪费处理器资源。
2. 锁消除
(1)定义
锁消除是指虚拟机即时编译器在运行时,对一些代码上要求同步,但是被检查到不可能存在共享数据竞争的锁进行消除。
(2)锁消除的主要判定依据
来源于逃逸分析的数据支持,如果判定在一段代码中,堆上的所有数据都不会逃逸出去从而被其他线程访问到,
那就可以把它们当做栈上数据对待,认为它们是线程私有的,同步加锁自然就无须进行。
(3)Java程序中“默认”存在的同步操作
程序员应该很清楚,怎么会明知道不存在数据争用的情况下要求同步呢?
需要注意,许多同步措施不是程序员自己加的,而是某些而Java程序自带的。
查看以下示例,仅仅是输出3个字符的相加结果,无论是源码字面还是程序语义上都没有同步:
//一段看起来没有同步的代码 public String concatString(String s1, String s2, String s3) { return s1 + s2 + s3; }
由于String 是一个不可变类,对字符串连接操作总是通过新的String 对象来进行,因此Javac 编译器会对String 类做自动优化:
// Javac 转化后的字符串连接操作 public String concatString(String s1, String s2, String s3) { StringBuffer sb = new StringBuffer(); sb.append(s1); sb.append(s2); sb.append(s3); return sb.toString(); }
代码分析
对于 javac 转化后的字符串连接操作代码中使用了同步,因为StringBuffer.append()
方法中都有一个同步块,锁就是sb对象。
虚拟机观察变量sb,很快就会发现他的动态作用域被限制在 concatString()
方法内部。也就是所 sb 的所有引用都不会“逃逸”到方法之外,其它线程无法访问。
因此,虽然这里有锁,但是可以被安全地消除掉,在即时编译之后,这段代码就会忽略掉所有的同步而直接执行了。
3. 锁粗化
(1)同步操作数量尽可能少原则
在编写代码时,总是推荐同步块的作用范围尽可能小——-
只在共享数据的实际作用域中才进行同步,这是为了同步操作数量尽可能少,如果存在锁竞争,那等待锁的线程也能尽快拿到锁。
(2)问题
大多数情况下,上面原则正确。
如果一系列的连续操作都对同一个对象反复加锁和解锁,甚至加锁操作是出现在循环体中的,那即使没有线程竞争,频繁地进行互斥同步操作也会导致不必要的性能损耗。
(3)解决方法——锁粗化
如果虚拟机探测到有这样一串零碎的操作都对同一个对象加锁,将会把加锁同步的范围扩展(粗化)到整个操作序列的外部。
(4)示例
如同以下代码中的连续append()
情况,直接扩展到第一个方法操作之前直至最后一个方法操作之后,这样只需要加锁一次就可以了。
public String concatString(String s1, String s2, String s3) { StringBuffer sb = new StringBuffer(); sb.append(s1); sb.append(s2); sb.append(s3); return sb.toString(); }
4. 轻量级锁
(1)定义和作用
定义:“轻量级”是相对于使用操作系统互斥量来实现的传统锁而言,传统的锁机制就称为“重量级”锁。
目的:轻量级锁并非用来代替重量级锁,本意是在没有多线程竞争的前提下,减少传统的重量级锁使用操作系统互斥量产生的性能消耗。
(2)HotSpot虚拟机的对象头
要理解轻量级锁,首先需要了解HotSpot虚拟机的对象头,分为两部分信息:
第一部分:用于存储对象自身的运行时数据,如哈希码,GC分代年龄等;
这部分数据的长度在32位和64位的虚拟机中分别为 32bit 和 64bit,官方称它为 Mark Word,它是实现轻量级锁和偏向锁的关键。
第二部分:用于存储指向方法区对象类型数据的指针,如果是数组对象的话,还会有一个额外的部分用于存储数组长度。
(3)HotSpot 虚拟机对象头Mark Word
对象头信息是与对象自身定义的数据无关的额外存储成本,
考虑到虚拟机的空间效率,Mark Word 被设计成一个非固定的数据结构以便在极小的空间内存储尽量多的信息,它会根据对象的状态复用自己的存储空间。
在不同状态下对象的存储内容如下:
(4)轻量级锁的加锁过程
在代码进入同步块的时候,轻量级锁的加锁过程如下:
1)如果此同步对象没有被锁定(锁标志位为01状态),虚拟机首先将在当前线程的栈帧中建立一个名为 锁记录的空间,用于存储对象目前的Mark Word 的拷贝。 2)然后,虚拟机将使用CAS 操作尝试将对象的 Mark Word 更新为指向 Lock Record的指针。 3)如果这个更新工作成功了,那么这个线程就拥有了该对象的锁,并且对象Mark Word的锁标志位将转变为 00,即表示 此对象处于轻量级锁定状态。 4)如果这个更新失败了,虚拟机首先会检查对象的Mark Word 是否指向当前线程的栈帧,
如果是说明当前线程已经拥有了这个对象的锁,那就可以直接进入同步块继续执行,否则说明这个锁对象以及被其他线程抢占了。
如果有两条以上的线程争用同一个锁,那轻量级锁就不再有效,要膨胀为重量级锁,锁标志的状态值变为 10,
Mark Word中存储的就是指向重量级(互斥量)的指针,后面等待锁的线程也要进入阻塞状态。
互斥量是一个可以处于两态之一的变量:解锁和加锁。这样,只需要一个二进制位表示它,不过实际上,常常使用一个整型量,0表示解锁,而其他所有的值则表示加锁。互斥量使用两个过程。当一个线程(或进程)需要访问临界区时,它调用mutex_lock。如果该互斥量当前是解锁的(即临界区可用),此调用成功,调用线程可以自由进入该临界区。
另一方面,如果该互斥量已经加锁,调用线程被阻塞,直到在临界区中的线程完成并调用mutex_unlock。如果多个线程被阻塞在该互斥量上,将随机选择一个线程并允许它获得锁。
(ps:
1,首先确定同步对象没有被锁定(根据对象头的mark word的锁标志位),那么将在线程栈帧上建立“锁记录空间”存放mark word拷贝。 2,通过cas操作在同步对象的markword中锁指向修改指向线程的锁记录空间,并且把锁标志位设为轻量锁。 3,如果成功或者更新失败但markword已经指向当前线程,那么进入同步快继续执行。否则这个对象锁正在被其他线程抢占。 4,如果两条以上线程争同一个锁,那么将变成重量锁。没有抢到的将阻塞(ps:猜测只是两条线程,那么不会阻塞,互相一直在抢占。)
(5)轻量级锁的解锁过程
1)如果对象的Mark Word仍然指向着线程的锁记录,那就用CAS 操作把对象当前的Mark Word 和 线程中复制的 Dispatched Mard Word替换回来。 2)如果替换成功,整个同步过程就完成。 3)如果替换失败,说明有其他线程尝试过获取该锁,那就要在释放锁的同时,唤醒被挂起的线程。
(6)小结
轻量级锁能提升程序同步性能的依据是: 对于绝大部分的锁,在整个同步周期内都是不存在竞争的。
如果没有竞争,轻量级锁使用CAS 操作避免了使用互斥量的开销。
如果存在锁竞争,除了互斥量的开销外,还额外发生了CAS 操作,因此在有竞争的情况下, 轻量级锁会比传统的重量级锁更慢。
(ps:互斥量导致阻塞,CAS会重复竞争(适合少竞争的情况),所以有竞争情况了,轻量锁更加慢)
5. 偏向锁
(1)定义与目的
目的:消除数据在无竞争情况下的同步原语,进一步提高程序的运行性能。
定义: 如果说轻量级锁是在无竞争的情况使用CAS 操作去消除同步使用的互斥量,那偏向锁就是在无竞争的情况下把整个同步都消除掉,连CAS 操作都不做了。
(2)偏向锁中的“偏”
它的意思是这个锁会偏向于 第一个获得它的线程,如果在接下来的执行过程中,该锁没有被其他的线程获取,则持有偏向锁的线程将永远不需要再进行同步。
(3)偏向锁的原理
若当前虚拟机启用了偏向锁,那么,当锁对象第一次被线程获取的时候,虚拟机将会把对象头中的标志位设为01, 即偏向模式。
同时使用CAS 操作把获取到这个锁的线程的ID 记录在对象的 Mark Word之中,
如果 CAS操作成功,持有偏向锁的线程以后每次进入这个锁相关的同步块时,虚拟机都可以不再进行任何同步操作。
(ps:cas更新应该会存类似记录,记录是否有线程进行抢锁)
(4)偏向锁、轻量级锁的状态转换及对象Mark Word的关系
当有另一个线程去尝试获取这个锁时,偏向模式就结束了。
根据锁对象目前是否处于被锁定的状态,撤销偏向后恢复到未锁定(标志位为01)或轻量级锁定(标志位为00)的状态,后续的同步操作就如上面介绍的轻量级锁那样执行。
(即:更加抢占线程的数量来决定锁)
偏向锁、轻量级锁的状态转换及对象Mark Word的关系如图:
(5)小结
偏向锁可以提高带有同步但无竞争的程序性能。如果程序中大多数的锁总是被多个不同的线程访问,那偏向模式是多余的。