Java虚拟机三 Java堆和栈
Java堆是和Java应用程序关系最为紧密的内存空间,几乎所有的对象都存放在堆中。并且堆是完全自动化管理的。
根据垃圾回收机制的不同,Java堆有可能有不同的结构。最为常见的一种就是将整个Java堆分为新生代和老年代。其中,新生代存放新生对象或者年龄不大的对象。
老年代存放老年对象。新生代可能分为eden区、s0区、s1区,s0和s1也被成为from和to区域,他们是两块大小相等,可以互换角色的内存空间。
在多数情况下,对象首先分配在eden区,在一次新生代回收后,如果对象还存活,则会进入s0或者s1,之后,每经过一次新生代回收,对象如果存活,他的年龄就会
加1.当对象的年龄达到一定条件后,就会进入老年代。
Java栈
Java栈是一块线程私有的内存空间。Java栈是和线程执行紧密相关的。线程执行的基本行为是函数调用,每次函数调用的数据都通过Java栈传递的。
Java栈中主要保存的是栈帧。每一次函数调用,都会有一个对应的栈帧被压入Java栈,每一个函数调用结束,都会有一个栈帧被弹出Java栈。
当函数返回时,栈帧从Java栈中被弹出。Java方法有两种返回函数的方式,一种是正常的函数返回,使用return指令;另外一种是抛出异常。
在一个栈帧中,至少要包含局部变量表、操作数栈和帧数据区几个部分。
由于每次函数调用都会产生对应的栈帧,从而占用一定的栈空间,因此如果栈空间不足,那么函数调用就无法继续下去。当请求的栈深度大于最大可用栈深度时,系统就
会抛出StackOverflowError的栈溢出错误。
Java虚拟机提供了参数-Xss来指定线程的最大栈空间,这个参数也直接决定了函数调用的最大深度。
下面的案例是一个递归调用,函数没有出口,代码会出现栈溢出错误,程度打印了最大的调用深度,使用参数-Xss256K执行代码,结果为2767
public class TestStackDeep { private static int count = 0; public static void recursion() { count++; recursion(); } public static void main(String[] args) { try { recursion(); }catch (Throwable e) { System.out.println("deep of calling = " + count); e.printStackTrace(); } } }
结果如下
deep of calling = 2767 java.lang.StackOverflowError at test1.TestStackDeep.recursion(TestStackDeep.java:9) at test1.TestStackDeep.recursion(TestStackDeep.java:9) at test1.TestStackDeep.recursion(TestStackDeep.java:9) at test1.TestStackDeep.recursion(TestStackDeep.java:9) at test1.TestStackDeep.recursion(TestStackDeep.java:9)
可以看到在大约2767次调用后,发生了栈溢出的错误,通过增大-Xss的值,可以获得更高层次。
函数嵌套调用的层次在很大程度上由栈的大小决定,栈越大,函数可以支持的嵌套调用次数就越多。
局部变量表
局部变量表是栈帧的重要组成部分,用于保存函数的参数以及局部变量。局部变量表中的变量只在当前函数调用中有效,当函数调用结束后,随着函数栈帧的销毁,局部变量表也会随之销毁。
由于局部变量表在栈帧之中,如果函数的参数和局部变量较多,会使得局部变量表膨胀,从而每一次函数调用就会占用更多的栈空间,最终导致函数的嵌套次数减少。
使用 jclasslib(JClassLib不但是一个字节码阅读器而且还包含一个类库允许开发者读取,修改,写入Java Class文件与字节码)工具可以进一步查看函数的局部变量信息。
栈帧中的局部变量表中的槽位可以重用,如果一个局部变量过了其作用域,那么其作用域后申明的新的局部变量就很有可以会复用其槽位,从而节省资源。
局部变量表中的变量也是重要的垃圾回收根节点,只要被局部变量表中直接或间接引用的对象都是不会被回收的。
局部变量对垃圾回收的影响案例:
public void localvarGc1(){ byte[] a = new byte[6*1024*1024]; System.gc(); } public void localvarGc2(){ byte[] a = new byte[6*1024*1024]; a = null; System.gc(); } public void localvarGc3(){ { byte[] a = new byte[6*1024*1024]; } System.gc(); } public void localvarGc4(){ { byte[] a = new byte[6*1024*1024]; } System.gc(); } public void localvarGc5(){ localvarGc1(); System.gc(); } public static void main(String [] args){ LocalVarGC ins = new LocalVarGC(); ins.localvarGc1(); }
上述代码中,每一个localvarGcN()函数都分配了一块6M的堆空间,并使用局部变量引用了这块空间。
在localvarGc1()中,在申请空间后,立即进行垃圾回收,由于byte数组被变量a引用,因此无法回收这块空间。
在localvarGc2()中,在垃圾回收之前,先将变量a置为null,使byte数组失去强引用,所以可以顺利回收byte数组。
对于localvarGc3(),在进行垃圾回收之前,先使局部变量a失效,虽然变量a已经离开工作域,但是变量a依然存在于局部变量中,并且也指向这块byte数组,所以byte数组依然无法被回收。
对于localvarGc4(), 在垃圾被回收之前,不仅是变量a失效,更是申明了变量c,使变量c服用了变量a的字,由于变量a此时被销毁,所以垃圾回收器可以顺利回收byte数组。
对于localvarGc5(), 它首先调用了localvarGc1(),很明显,在localvarGc1()中,并没有释放byte数组,但是在localvarGc1()返回后,他的栈帧被销毁,栈帧中所有的局部变量也被销毁,所以byte数组失去引用,在localvarGc5()的垃圾回收中被回收。
可以使用参数 -XX:+PrintGC 执行上述几个函数,在输出的日志中,可以看到垃圾回收前后堆的大小,进而判断byte数组是否被回收。
操作数栈
操作数栈也是栈帧中重要的内容之一,主要用于保存计算过程中的中间结果,同时作为计算过程中变量临时的存储空间。
操作数栈也是一个先进先出的数据结构,只支持入栈和出栈两种操作。许多Java字节码指令都需要通过操作数栈进行参数传递。
帧数据区
除了局部变量表和操作数栈外,Java栈帧还需要一些数据来支持常量池解析、正常方法返回和异常处理等。大部分Java字节码指令需要进行常量池访问,在帧数据区中保存着访问常量池的指针,方便程序访问常量池。
此外,当函数返回或者出现异常时,虚拟机必须恢复调用者函数的栈帧,并让调用者函数继续执行下去。对于异常处理,虚拟机必须有一个异常处理表,方便在发生异常的时候找到处理异常的代码,因此,异常处理表也是帧数据区中最重要的一部分。
栈上分配
栈上分配是Java虚拟机提供的意向优化技术,对于那些线程私有的对象,可以将 它们打散分配在栈上,而不是分配在堆上。分配在栈上的好处是可以在函数调用结束后自行销毁,而不需要垃圾回收器的介入,从而提高系统的性能。
栈上分配的一个技术基础是进行逃逸分析。逃逸分析的目的是判断对象的作用域是否有可能逃逸出函数体。
对于大量的零散小对象,栈上分配提供了一种很好的对象分配优化策略,栈上分配速度快,并且可有有效避免垃圾回收带来的负面影响,单由于和堆空间相比,栈空间较小,所以大对象无法也不适合在栈上分配。
方法区
和Java堆一样,方发区是一块所有线程共享的内存区域。他用于保存系统的类信息,比如类的字段、方法、常量池等。方法区的大小决定了可以保存多少个类,如果系统定义了太多的类,导致方法区溢出,虚拟机同样会抛出内存溢出的错误。
在JDK1.6和JDK1.7中,方法区可以理解为永久区(Perm)。永久区可以使用参数-XX:PermSize 和 -XX:MaxPermSize指定,默认情况下,-XX:MaxPermSize为64MB。一个大的永久区可以保存更多的类信息。如果系统使用了一些动态代理,那么有可能在运行时
生成大量的类。
在JDK1.8中,永久区已经被彻底移除。取而代之的是元数据区,元数据区的大小可以使用参数-XX:MaxMetaspaceSize指定,这是一块堆外的直接内存。与永久区不同,如果不指定大小,默认情况下,虚拟机会耗尽所有的可用系统内存。