作者:郭嘉
邮箱:allenwells@163.com
博客:http://blog.csdn.net/allenwells
github:https://github.com/AllenWell
为什么会Java虚拟机会同一时候存在解释器和编译器呢?
这是为了兼顾启动效率和运行效率两个方面。Java程序最初是通过解释器进行解释运行的,当虚拟机返现某个方法或代码块的运行特别频繁时,就会把这段代码标记为热点代码,为了提供热点代码的运行效率,在运行时,虚拟机就会把这些代码编译成与本地平台相关的机器码。并进行各种层次的优化。
当编译器做的激进优化不成立,不如载入了新类后类型继承结构出现变化。出现了罕见陷阱时能够进行逆优化退回到解释状态继续运行。
以上描写叙述的两种配合关系例如以下图所看到的:
一 编译模式
HotSpot JVM内置了两个编译器,各自是Client Complier和Server Complier,虚拟机默认是Client模式。我们也能够通过
- -client:强制虚拟机运行Client模式
- -server:强制虚拟机运行Server模式
而不管是Client模式还是Server模式,虚拟机都会运行在解释器和编译器配合使用的混合模式下。能够通过
- -Xint:强制虚拟机运行于解释模式
- -Xcomp:强制虚拟机运行于编译模式
以上描写叙述的运行模式例如以下图所看到的:
二 分层编译
为什么会存在分层编译?
这是由于编译器编译本机代码须要占用程序运行时间,要编译出优化程度更高的代码锁花费的时间可能更长,并且想要编译出优化程度更高的代码,解释器可能还要替编译器收集性能监控信息。这对解释运行的速度也有影响。为了在程序启动响应速度和运行效率之间寻找平衡点。因此採用分层编译的策略。
分层策略例如以下所看到的:
- 第0层:程序解释运行。解释器不开启性能监控功能,可触发第1层编译。
- 第1层:即C1编译。将字节码编译为本地代码。进行简单和可靠的优化,如有必要将增加性能监控的逻辑。
- 第2层:即C2编译,将字节码编译为本地代码,同一时候启用一些编译耗时较长的优化,甚至会依据性能监控信息进行一些不可靠的激进优化。
三 编译对象
编译对象即为会被编译优化的热点代码。有下面两类:
- 被多次调用的方法
- 被多次运行的循环体
四 触发条件
上面描写叙述中使用多次这个概念,那么什么算多次呢?
这就牵扯到触发条件这个概念,推断一段代码是否是热点代码。是否须要触发即时编译,这样的行为成为热点探測(Spot Dectection)。
热点探測有两种手段:
4.1 基于採样的热点探測(Sample Based Hot Spot Dectection)
虚拟机会周期性的检查各个线程的栈顶,假设发现某些方法常常性的出如今栈顶,那么这种方法就是热点方法。
4.2 基于计数器的热点探測(Counter Based Hot Spot Dectection)
虚拟机会为每一个方法或代码块建立计数器,统计方法的运行次数。假设运行次数超过一定的阈值就觉得他是热点方法。
HotSpot JVM使用另外一种方法基于计数器的热点探測方法。它为每一个方法准备了两类计数器:
4.2.1 方法调用计数器
这个阈值在Client模式下是1500次。在Server模式下是10000此,这个阈值能够通过參数-XX:CompileThreadhold来人为设定。
假设不做不论什么设置。方法调用次数统计的并非方法被调用的绝对次数,而是相对的运行频率,即一段时间内方法被调用的次数,当超过一定时间限度,假设方法的调用次数仍然不足以让它提交给即时编译器编译,那这种方法的调用计数器会被降低一半,这个过程被称为方法调用计数器的热度衰减(Counter Decay)。而这段时间就称为此方法统计的半衰周期(Counter Half Life Time)。相同也能够使用參数-XX:-UseCounterDecay来关闭热度衰减。
方法调用计数器触发即时编译的整个流程例如以下图所看到的:
4.2.2 回边计数器
什么是回边?
在字节码遇到控制流向后跳转的指令称为回边(Back Edge)。
回边计数器是用来统计一个方法中循环体代码运行的次数,回边计数器的阈值能够通过參数-XX:OnStackReplacePercentage来调整。
- 虚虚拟机运行在Client模式下,回边计数器阂值计算公式为:
方法调用计数器闭值( CompileThreshold) xOSR比率(OnStackReplacePercentage) / 100
当中OnSlackReplacePercentage默认值为933,假设都取默认值.那Client模式虚拟机的回边计数器的阂值为13995.
- 虚拟机运行在Servo模式下,回边计数器阂值的itm公式为:
方法调用计数器阂值(CompileThmshold) x (OSR比率(OnStackReplacePercentage) - 解释器监控比率(InterpreterProffePercentage) / 100
当中OnStackReplacePementage默认值为140. InterpreterPmfilePercenmgc默认值为33.
假设都取默认值。BF Server模式虚拟机回边计数器的阑值为10700。
回边计数器触发即时编译的流程例如以下图所看到的:
回边计数器与方法调用计数器不同的是,回边计数器没有热度衰减,因此这个计数器统计的就是循环运行的绝对次数。
五 编译流程
在默认设置下,不管是方法调用产生的即时编译请求,还是OSR编译请求,虚拟机在代码编译器还未完毕之前,都仍然依照解释方式继续进行,而编译动作则在后台的编译线程中继续进行。也能够使用-XX:-BackgroundCompilation来禁止后台编译,则此时一旦遇到JIT编译,运行线程向虚拟机提交请求后会一直等待,直到编译完毕后再開始运行编译器输出的本地代码。
那么在后台编译过程中,编译器做了什么事呢?
Server Compiler和Client Compiler的后台编译过程是不一样的,我们来分别看一下。
5.1 Client Compiler编译流程
- 第一阶段:一个平台独立的前端将字节码构造成一种高级中间码表示(High Level Infermediate Representaion),HIR使用静态单分配的形式来表示代码值,这能够使得一些的构造过程之中和之后进行的优化动作更easy实现,在此之前编译器会在字节码上完毕一部分基础优化,如方法内联、常量传播等。
- 第二阶段:一个平台相关的后端从HIR中产生低级中间代码表示(Low Level Intermediate Representation),而在此之前会在HIR上完毕还有一些优化。如空值检查消除、范围检查消除等。以便让HIR达到更高效的代码表示形式。
- 第三阶段:在平台相关的后端使用线性扫描算法(Linear Scan Register Allocation)在LIR上分配寄存器,并在LIR上做窥孔优化(Peephole)优化,然后产生机器码。
整个步骤例如以下图所看到的:
5.1 Server Compiler编译流程
Server Compiler是专门面向服务端的典型应用并为服务器的性能配置特别调整过的编译器,它会运行全部经典的优化动作。例如以下所看到的:
- 无用代码消除
- 循环展开
- 循环表达式外提
- 消除公共子表达式
- 常量传播
- 基本块重排序
- 范围检查消除
- 空值检查消除
- 守护内联
- 分支频率预測