JVM原理和调优

本文是学习时的自我总结,用于日后温习。如有错误还望谅解,不吝赐教

此处附上本文出处:http://blog.csdn.net/hjxgood/article/details/53896229

 

一、什么是JVM

JVM是一个虚构出来的计算机,实现了编程语言(如Java、Scala)的与平台的无关性

 

二、Java代码编译和执行过程

1.   Java代码编译和执行包含的三个重要机制:

  1)   Java源码编译机制

  2)   类加载机制

  3)   类执行机制

2.   Java代码编译是由Java源码编译器来完成,由源代码编译为JVM字节码

3.   Java字节码的执行是由JVM执行引擎来完成,由JVM字节码编译为目标代码

 

1.Java源码编译机制由以下三个过程组成:

  • 分析和输入到符号表
  • 注解处理
  • 语义分析和生成class文件

最后生成的class文件由以下部分组成:

  • 结构信息。包括class文件格式版本号及各部分的数量与大小的信息
  • 元数据。对应于Java源码中声明与常量的信息。包含类/继承的超类/实现的接口的声明信息、域与方法声明信息和常量池
  • 方法信息。对应Java源码中语句和表达式对应的信息。包含字节码、异常处理器表、求值栈与局部变量区大小、求值栈的类型记录、调试符号信息

 

2.类加载机制。JVM的类加载是通过ClassLoader及其子类完成的

1)Bootstrap ClassLoader

负责加载JAVA_HOME中jre/lib/rt.jar里所有的class,由C++实现,不是ClassLoader子类

2)Extension ClassLoader

负责加载java平台中扩展功能的一些jar包,包括$JAVA_HOME中jre/lib/*.jar或-Djava.ext.dirs指定目录下的jar包

3)App ClassLoader

负责加载classpath中指定的jar包及目录中class

4)Custom ClassLoader

属于应用程序根据自身需要自定义的ClassLoader,如tomcat、jboss

加载过程中会先检查类是否被已加载,检查顺序是自底向上,从Custom ClassLoader到BootStrap ClassLoader逐层检查,保证此类只所有ClassLoader加载一次。

加载的顺序是自顶向下,也就是由上层来逐层尝试加载此类。

 

3.类执行机制

1)   JVM是基于栈的体系结构来执行class字节码的。

2)   线程创建后,都会产生程序计数器(PC)和栈(Stack),程序计数器存放下一条要执行的指令在方法内的偏移量,栈中存放一个个栈帧,每个栈帧对应着每个方法的每次调用。

3)   栈帧是由局部变量区和操作数栈两部分组成,局部变量区用于存放方法中的局部变量和参数,操作数栈中用于存放方法执行过程中产生的中间结果。

 

三、JVM内存管理

JVM由堆、栈、本地方法栈、方法区等部分组成

 1.堆

  所有通过new创建的对象的内存都在堆中分配,堆的大小可以通过-Xmx和-Xms来控制。

  堆被划分为新生代和旧生代,新生代又被分为Eden和Survivor区,Survivor由From Space和To Space组成

  • 新生代。新建的对象都是用新生代分配内存,Eden空间不足时,会把存活的对象转移到Survivor中
  • 旧生代。用于存放新生代中经过多次垃圾回收仍然存活的对象
  • 持久带。主要存放所有已加载的类信息,方法信息,常量池等等

2.栈

  每个线程执行每个方法的时候都会在栈中申请一个栈帧,每个栈帧包括局部变量区和操作数栈,用于存放此次方法调用过程中的临时变量、参数和中间结果。

  -xss:设置每个线程的堆栈大小。JDK1.5+ 每个线程堆栈大小为1M,一般来说如果栈不是很深的话,1M 是够用的

 

 3.本地方法栈

  用于支持native方法的执行,存储了每个native方法调用的状态

4.方法区

  存放了要加载的类信息、静态变量、final类型的常量、属性和方法信息。

 

四、垃圾回收

1.垃圾回收基本策略

  1)   引用计数:

  较古老的回收算法。原理是此对象有一个引用即增加一个计数,删除一个引用则减少一个计数。垃圾回收时,只用手机计数为0的对象。此算法最致命的是无法处理循环引用的问题

  2)   标记清除:

  此算法执行分两阶段。第一阶段从引用根节点开始标记所有被引用的对象,第二阶段遍历整个堆,把未标记的对象清除。此算法需要暂停整个应用,同时会产生内存碎片

  3)   复制:

  此算法把内存空间划为两个相等的区域,每次只使用其中一个区域。

垃圾回收时,遍历当前使用区域,把正在使用中的对象复制到另外一个区域中。算法每次只处理正在使用中的对象,因此复制成本比较小,同时复制过去以后还能进行相应的内存整理,不会出现“碎片”问题。当然,此算法的缺点也是很明显的,就是需要两倍内存空间

  4)   标记-整理(Mark-Compact):

  结合了“标记-清除”和“复制”两个算法的优点。也是分两阶段,第一阶段从根节点开始标记所有被引用对象,第二阶段遍历整个堆,清除未标记对象 并且 把存活对象“压缩”到堆的其中一块,按顺序排放。此算法避免了“标记-清除”的碎片问题,同时也避免了“复制”算法的空间问题

 

2.新生代的GC:

新生代通常存活时间较短,因此基于 复制算法 来进行回收,即扫描出存活的对象,并复制到一块新的完全未使用的空间中。

新生代采用空闲指针的方式来控制GC触发指针保持最后一个分配的对象在新生代区间的位置,当有新的对象要分配内存时,用于检查空间是否足够,不够就触发GC。当连续分配对象时,对象会逐渐从eden到survivor,最后到旧生代。

3.旧生代的GC:

旧生代对象存活的时间比较长,比较稳定,因此采用标记(Mark)算法来进行回收,即扫描出存活的对象,然后回收未被标记的对象,回收后对用空出的空间要么进行合并,要么标记出来便于下次进行分配,总之就是要减少内存碎片带来的效率损耗。

4.  在执行机制上JVM提供了串行GC(Serial GC)、并行回收GC(Parallel Scavenge)和并行GC(ParNew)

1)串行GC

在整个扫描和复制过程采用单线程的方式来进行,适用于单CPU、新生代空间较小及对暂停时间要求不是非常高的应用上,是client级别默认的GC方式

2)并行回收GC

在整个扫描和复制过程采用多线程的方式来进行,适用于多CPU、对暂停时间要求较短的应用上,是server级别默认采用的GC方式

3)并行GC

与旧生代的并发GC配合使用

 

五、JVM内存调优

对JVM内存调优的时候不能只看操作系统级别Java进程所占用的内存,这个数值不能准确的反应堆内存的真实占用情况,因为GC过后这个值是不会变化的,因此内存调优的时候要更多地使用JDK提供的内存查看工具

对JVM内存的系统级的调优主要的目的是减少GC的频率和Full GC的次数,过多的GC和Full GC是会占用很多的系统资源(主要是CPU),影响系统的吞吐量。特别要关注Full GC,因为它会对整个堆进行整理

 

1.导致Full GC一般由于以下几种情况:

1)   旧生代空间不足
调优时尽量让对象在新生代GC时被回收、让对象在新生代多存活一段时间和不要创建过大的对象及数组避免直接在旧生代创建对象 

2)   Pemanet Generation空间不足
增大Perm Gen空间,避免太多静态对象 

统计得到的GC后晋升到旧生代的平均大小大于旧生代剩余空间

控制好新生代和旧生代的比例 

3)   System.gc()被显示调用

垃圾回收不要手动触发,尽量依靠JVM自身的机制

 

2.调优手段主要通过控制堆内存的各个部分的比例和GC策略来实现,下面是各部分比例不良设置会导致的后果

1)   新生代设置过小

新生代GC次数非常频繁,增大系统消耗;导致大对象直接进入旧生代,占据了旧生代剩余空间,诱发Full GC

2)   新生代设置过大

新生代GC耗时大幅度增加;导致旧生代过小(堆总量一定),从而诱发Full GC

一般说来新生代占整个堆1/3比较合适

3)   Survivor设置过小

导致对象从eden直接到达旧生代,降低了在新生代的存活时间

4)   Survivor设置过大

   导致eden过小,增加了GC频率

 

3.JVM提供两种较为简单的GC策略的设置方式

1)吞吐量优先。JVM以吞吐量为指标,自行选择相应的GC策略及控制新生代与旧生代的大小比例,来达到吞吐量指标。

2)暂停时间优先。JVM以暂停时间为指标,自行选择相应的GC策略及控制新生代与旧生代的大小比例,尽量保证每次GC造成的应用停止时间都在指定的数值范围内完成。

posted @ 2017-12-17 17:58  mflood  阅读(422)  评论(0编辑  收藏  举报