Java并发(五):synchronized实现原理
一、synchronized用法
Java中的同步块用synchronized标记。
同步块在Java中是同步在某个对象上(监视器对象)。
所有同步在一个对象上的同步块在同时只能被一个线程进入并执行操作。
所有其他等待进入该同步块的线程将被阻塞,直到执行该同步块中的线程退出。
(注:不要使用全局对象(常量等)做监视器。应使用唯一对应的对象)
public class MyClass { int count; // 1.实例方法 public synchronized void add(int value){ count += value; } // 2.实例方法中的同步块 (等价于1) public void add(int value){ synchronized(this){ count += value; } } // 3.静态方法 public static synchronized void add(int value){ count += value; } // 4.静态方法中的同步块 (等价于3) public static void add(int value){ synchronized(MyClass.class){ count += value; } } }
二、Java对象模型
每一个Java类,在被JVM加载的时候,JVM会给这个类创建一个instanceKlass
,保存在方法区,用来在JVM层表示该Java类。
使用new创建一个对象的时候,JVM会创建一个instanceOopDesc
对象,这个对象中包含了两部分信息,对象头以及实例数据。
对象头中包括两部分:(一)Mark Word 一些运行时数据,其中就包括和多线程相关的锁的信息。
(二)Klass Point 元数据其实维护的是指针,指向的是对象所属的类的instanceKlass
。
Mark Word 用于存储对象自身的运行时数据,如哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程 ID、偏向时间戳等等。
对象头信息是与对象自身定义的数据无关的额外存储成本,但是考虑到虚拟机的空间效率,Mark Word被设计成一个非固定的数据结构以便在极小的空间内存存储尽量多的数据,它会根据对象的状态复用自己的存储空间,也就是说,Mark Word会随着程序的运行发生变化。
对象存储结构:
对象的实例(instantOopDesc)保存在堆上,对象的元数据(instantKlass)保存在方法区,对象的引用保存在栈上。
三、Moniter
为了解决线程安全的问题,Java提供了同步机制、互斥锁机制,这个机制保证了在同一时刻只有一个线程能访问共享资源。这个机制的保障来源于监视锁Monitor。
每一个Object对象中内置了一个Monitor对象。(对象头的MarkWord中的LockWord指向monitor的起始地址)
Monitor相当于一个许可证,线程拿到许可证即可以进行操作,没有拿到则需要阻塞等待。
ObjectMonitor中有几个关键属性:
_owner:指向持有ObjectMonitor对象的线程
_WaitSet:存放处于wait状态的线程队列
_EntryList:存放处于等待锁block状态的线程队列
_recursions:锁的重入次数
_count:用来记录该线程获取锁的次数
线程T等待对象锁:_EntryList中加入T
线程T获取对象锁:_EntryList移除T,_owner置为T,计数器_count+1
持有对象锁的线程调用wait():_owner置为T,计数器_count+1,_WaitSet中加入T
四、synchronized原理
利用javap工具查看生成的class文件信息来分析Synchronize的实现
(摘自: 【死磕Java并发】—–深入分析synchronized的实现原理)
public class SynchronizedTest { public synchronized void test1(){ } public void test2(){ synchronized (this){ } } }
同步代码块:monitorenter指令插入到同步代码块的开始位置,monitorexit指令插入到同步代码块的结束位置,JVM需要保证每一个monitorenter都有一个monitorexit与之相对应。任何对象都有一个monitor与之相关联,当且一个monitor被持有之后,他将处于锁定状态。线程执行到monitorenter指令时,将会尝试获取对象所对应的monitor所有权,即尝试获取对象的锁;
同步方法:synchronized方法则会被翻译成普通的方法调用和返回指令如:invokevirtual、areturn指令,在VM字节码层面并没有任何特别的指令来实现被synchronized修饰的方法,而是在Class文件的方法表中将该方法的access_flags字段中的synchronized标志位置1,表示该方法是同步方法并使用调用该方法的对象或该方法所属的Class在JVM的内部对象表示Klass做为锁对象。
五、synchronized解决并发问题
synchronized保证原子性
1)通过monitorenter
和monitorexit
指令,可以保证被synchronized
修饰的代码在同一时间只能被一个线程访问,在锁未释放之前,无法被其他线程访问到。
2)即使在执行过程中,由于某种原因,比如CPU时间片用完,线程1放弃了CPU,但是它并没有进行解锁。而由于synchronized
的锁是可重入的,下一个时间片还是只能被他自己获取到,还是会继续执行代码。直到所有代码执行完。
synchronized保证可见性
保证可见性规则:对一个synchronized修饰的变量解锁之前,必须先把此变量同步回主存中。
synchronized保证有序性
由于synchronized
修饰的代码,同一时间只能被同一线程访问。(如果在本线程内观察,所有操作都是天然有序的)
synchronized
是无法禁止指令重排和处理器优化的,但是同一线程内的执行遵守as-if-serial语义。
六、锁优化
重量级锁
synchronized
其实是借助Monitor实现的,在加锁时会调用objectMonitor的enter
方法,解锁的时候会调用exit
方法。
通过对象内部的监视器(monitor)实现,其中monitor的本质是依赖于底层操作系统的Mutex Lock实现,操作系统实现线程之间的切换需要从用户态到内核态的切换,切换成本非常高。
Java的线程是映射到操作系统原生线程之上的,如果要阻塞或唤醒一个线程就需要操作系统的帮忙,这就要从用户态转换到核心态,因此状态转换需要花费很多的处理器时间,是java语言中一个重量级的操纵。
只有在JDK1.6之前,synchronized的实现才会直接调用ObjectMonitor的enter
和exit。
在JDK1.6中出现对锁进行了很多的优化,进而出现轻量级锁,偏向锁,锁消除,适应性自旋锁,锁粗化。
自旋锁
共享数据的锁定状态一般只会持续很短的一段时间,为了这段时间去挂起和恢复线程其实并不值得。
让后面来的线程“稍微等一下”,但是并不放弃处理器的执行时间,看看持有锁的线程会不会很快释放锁。这个“稍微等一下”的过程就是自旋。(怎么等待呢?执行一段无意义的循环即可)
1、由于自旋锁只是将当前线程不停地执行循环体,不进行线程状态的改变,所以响应速度更快。
2、但当线程数不停增加时,性能下降明显,因为每个线程都需要执行,占用CPU时间。
3、自旋锁和阻塞锁最大的区别就是,到底要不要放弃处理器的执行时间。阻塞锁是放弃了CPU时间,进入了等待区,等待被唤醒。而自旋锁是一直“自旋”在那里,时刻的检查共享资源是否可以被访问。
锁消除
JVM检测到不可能存在共享数据竞争,这是JVM会对这些同步锁进行锁消除。锁消除的依据是逃逸分析的数据支持。
注意:我们在使用一些JDK的内置API时,如StringBuffer、Vector、HashTable等,这个时候会存在隐形的加锁操作。
// 在运行这段代码时,JVM可以明显检测到变量vector没有逃逸出方法vectorTest()之外,所以JVM可以大胆地将vector内部的加锁操作消除。 public void vectorTest() { Vector<String> vector = new Vector<String>(); for (int i = 0; i < 10; i++) { vector.add(i + "");// vector是线程安全的,每个方法都有synchronized修饰 } System.out.println(vector); }
锁粗化
我们提倡尽量减小锁的粒度:使用同步锁的时候,需要让同步块的作用范围尽可能小—仅在共享数据的实际作用域中才进行同步,这样做的目的是为了使需要同步的操作数量尽可能缩小,如果存在锁竞争,那么等待锁的线程也能尽快拿到锁。
问题:如果一系列的连续加锁解锁操作,可能会导致不必要的性能损耗。
锁粗化:将多个连续的加锁、解锁操作连接在一起,扩展成一个范围更大的锁。
for(int i=0;i<100000;i++){ synchronized(this){ do(); } // 被优化之后 synchronized(this){ for(int i=0;i<100000;i++){ do(); }
轻量级锁
引入轻量级锁的主要目的是在没有多线程竞争的前提下,减少传统的重量级锁使用操作系统互斥量产生的性能消耗。
只有在“对于绝大部分的锁,在整个生命周期内都是不会存在竞争的”情况下,轻量级锁才有较好的性能。
如果存在竞争的情况,轻量级锁需要膨胀为重量级锁,而且还会有额外的CAS操作,会比重量级锁性能更差。
正常获取锁过程:
1)当前线程的栈帧中建立一个的空间Lock Record,将锁对象的Mark Word的拷贝过来
2)JVM利用CAS操作将对象的Mark Word更新为指向Lock Record的指针,如果成功表示竞争到锁
3)直接执行同步块代码,不需要monitor
获取锁所有情况:
1)判断当前对象是否处于无锁状态(hashcode、0、01)
无锁状态:JVM首先将在当前线程的栈帧中建立一个名为锁记录(Lock Record)的空间,用于存储锁对象目前的Mark Word的拷贝,执行(2)
有锁:执行步骤(3);
2)JVM利用CAS操作尝试将对象的Mark Word更新为指向Lock Record的指针
更新指针成功:表示竞争到锁,则将锁标志位变成00(表示此对象处于轻量级锁状态),直接执行同步块代码,不需要monitor,结束;
更新指针成功:未竞争到锁,执行步骤(3);
3)判断当前对象的Mark Word是否指向当前线程的栈帧,
指向当前线程的栈帧:表示当前线程已经持有当前对象的锁,则直接执行同步代码块,不需要monitor,结束;
不指向当前线程的栈帧:说明该锁对象已经被其他线程抢占了,这时轻量级锁需要膨胀为重量级锁,锁标志位变成10,后面等待的线程将会进入阻塞状态;
释放锁 :
1)取出在获取轻量级锁保存在Displaced Mark Word中的数据;
2)用CAS操作将取出的数据替换当前对象的Mark Word中,如果成功,则说明释放锁成功,否则执行(3);
3)如果CAS操作替换失败,说明有其他线程尝试获取该锁,则需要在释放锁的同时需要唤醒被挂起的线程。
偏向锁
引入偏向锁主要目的是:为了在无多线程竞争的情况下尽量减少不必要的轻量级锁执行路径。
获取锁
1)检测Mark Word是否为可偏向状态,即是否为偏向锁1,锁标识位为01;
2)若为可偏向状态,则测试线程ID是否为当前线程ID,如果是,则执行步骤(5),否则执行步骤(3);
3)如果线程ID不为当前线程ID,则通过CAS操作竞争锁,竞争成功,则将Mark Word的线程ID替换为当前线程ID,否则执行线程(4);
4)通过CAS竞争锁失败,证明当前存在多线程竞争情况,当到达全局安全点,获得偏向锁的线程被挂起,偏向锁升级为轻量级锁,然后被阻塞在安全点的线程继续往下执行同步代码块;
5)执行同步代码块
释放锁
偏向锁的释放采用了一种只有竞争才会释放锁的机制,线程是不会主动去释放偏向锁,需要等待其他线程来竞争。偏向锁的撤销需要等待全局安全点(这个时间点是上没有正在执行的代码)。其步骤如下:
1)暂停拥有偏向锁的线程,判断锁对象石是否还处于被锁定状态;
2)撤销偏向苏,恢复到无锁状态(01)或者轻量级锁的状态;