jvm系列(二):JVM内存结构
JVM内存结构主要有三大块:堆内存、方法区和栈。堆内存是JVM中最大的一块由年轻代和老年代组成,而年轻代内存又被分成三部分,Eden空间、From Survivor空间、To Survivor空间,默认情况下年轻代按照8:1:1的比例来分配;
方法区存储类信息、常量、静态变量等数据,是线程共享的区域,为与Java堆区分,方法区还有一个别名Non-Heap(非堆);栈又分为java虚拟机栈和本地方法栈主要用于方法的执行。
在通过一张图来了解如何通过参数来控制各区域的内存大小
控制参数
-Xms设置堆的最小空间大小。
-Xmx设置堆的最大空间大小。
-XX:NewSize设置新生代最小空间大小。
-XX:MaxNewSize设置新生代最大空间大小。
-XX:PermSize设置永久代最小空间大小。
-XX:MaxPermSize设置永久代最大空间大小。
-Xss设置每个线程的堆栈大小。
没有直接设置老年代的参数,但是可以设置堆空间大小和新生代空间大小两个参数来间接控制。
老年代空间大小=堆空间大小-年轻代大空间大小
从更高的一个维度再次来看JVM和系统调用之间的关系
程序计数器(Program Counter Register)
1. 概述
- 程序计数器是一块较小的内存空间,它的作用可以看做是当前线程所执行的字节码的行号指示器。
- 在概念模型中,字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要这个计数器来完成
- Java 虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时刻,一个处理器(对于多喝处理器来说是一个内核)只会执行一条线程中的指令。
- 因此,为了线程切换后能恢复到正确的执行位置,每个线程都需要有一个独立的程序计数器,各条线程之间的计数器互不影响,独立存储,称这类内存区域为**“线程私有”**的内存。
- 如果线程现在正在执行的是一个 Java 方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址
- 如果线程正在执行的是 Native 方法,这个计数器值则为空(Undefined)(Native方法是非Java语言编写,比如c/c++,它们无法在 Java 编译时生成字节码,即JVM 获取不到 native 实现, 只能通过系统指令去调用native方法)
- 此内存区域是唯一一个在 Java 虚拟机规范中没有规定任何 OutOfMemoryError情况的区域
2.特点
- 占内存很小,唯一不会规定任何 OutOfMemoryError情况
- 线程私有
- 对java方法是字节码指令的地址,对 Native 方法是 Undefined
JVM栈(JVM Stacks)
概述
- 和程序计数器一样,Java 虚拟机栈也是线程私有的,它的生命周期与线程相同。
- 虚拟机栈描述的是 Java 方法执行的内存模型:每个方法被执行的时候都会同时创建一个栈帧(Stack Frame)用于存储局部变量表、操作栈、动态链接、方法出口等消息。
- 对这个区域规定了两种异常状况:
- 如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常。
- 如果虚拟机栈可以动态扩展,当扩展时无法申请到足够的内存时会抛出 OutOfMemoryError 异常。
1.栈帧的概念
栈帧(Stack Frame) 是用于支持虚拟机进行方法调用和方法执行的数据结构。栈帧存储了方法的局部变量表、操作数栈、动态连接和方法返回地址等信息。每个方法从调用至执行完成的过程,都对应着一个栈帧在虚拟机栈里入栈到出栈的过程。
一个线程中方法的调用链可能很长,很多地方都同时处于执行状态。对于JVM 执行引擎来说,在在活动线程中,只有位于 JVM 虚拟机栈栈顶的元素才是有效的,即成为当前栈帧,与这个栈帧相关连的方法称为当前方法,定义这个方法的类叫做当前类。
执行引擎运行的所有字节码指令都只针对当前栈帧进行操作。如果当前方法调用了其他方法,或者当前方法执行结束,那这个方法的栈帧就不再是当前栈帧。
在概念模型上,典型的栈帧结构如下
2. 局部变量表(Local Variable Table)
局部变量表是一组变量值存储空间,用于存放方法参数和方法内定义的局部变量。局部变量表的容量以 变量槽(Variable Slot) 为最小单位,Java虚拟机规范并没有定义一个槽应该占用内存空间的大小,但是规定一个槽应该可以存放一个32位以内的数据类型。
一个局部变量可以保存一个类型为boolean(理论上是1/8字节,但是java中没有名明确大小)
、byte(一个字节)
、char(两个字节)
、short(两个字节)
、int(四个字节)
、float(四个字节)
、reference(对象引用,它不等同于对象本身,根据不同的虚拟机实现,它可能是一个指向对象起始地址的引用指针,也可能指向一个代表对象的句柄或与其他与此对象相关的位置)
和 returnAddress(指向了一条字节码指令的地址)
类型的数据。
3. 操作数栈(Operand Stack)
操作数栈也常称为操作栈。同局部变量表一样,操作数栈的最大深度也在编译的时候写入到方法的Code属性的max_stacks数据项中。
操作数栈的每一个元素可以是任意的Java数据类型,32位的数据类型占一个栈容量,64位的数据类型占两个栈容量,且在方法执行的任意时刻,操作数栈的深度都不会超过max_stacks中设置的最大值。
当一个方法刚刚开始执行时,其操作数栈是空的,随着方法执行和字节码指令的执行,会从局部变量表或对象实例的字段中复制常量或变量写到操作数栈,再随着计算的进行将栈中元素出栈到局部变量表或者返回给方法调用者,也就是出栈/入栈操作。一个完整的方法执行期间往往包含多个这样出栈/入栈的过程。
begin iload_0 // 将本地变量0中的int推入堆栈 iload_1 // 将本地变量1中的int推入堆栈 iadd // pop two ints, add them, push result istore_2 // 弹出int,存储到本地变量2中 end
在这个字节码序列里,前两个指令iload_0和iload_1将存储在局部变量表中索引为0和1的整数压入操作数栈中,其后iadd指令从操作数栈中弹出那两个整数相加,在将结果压入操作数栈。istore_2则从操作数栈中弹出结果,并把它存储在局部变量表索引为2的位置。
4. 动态链接
在一个class文件中,一个方法要调用其他方法,需要将这些方法的符号引用转化为其在内存地址中的直接引用,而符号引用存在于方法区中的运行时常量池。
Java虚拟机栈中,每个栈帧都包含一个指向运行时常量池中该栈所示方法的符号引用,持有这个引用的目的是支持方法调用过程中的动态链接。
这些符号引用一部分会在类加载阶段或第一次使用时就直接转化为直接引用,这类转化称为静态解析。另一部分将在每次运行期间转换为直接引用,这类转化称为动态链接。
5. 方法返回
当一个方法开始执行时,可能有两种方法退出该方法:
- 正常完成出口
- 异常完成出口
正常完成出口是指方法正常完成并退出,没有抛出任何异常。如果当前方法正常完成,则根据当前方法返回的字节码指令,这时可能会有返回值传递给方法调用者,或无返回值。
异常完成出口是指方法执行过程中遇到异常,并且这个异常在方法体内部没有得到处理,导致方法退出。
无论方法采用何种方式退出,在方法退出后都需要返回到方法被调用的位置,程序才能继续执行,方法返回时可能需要在当前栈帧中保存一些信息,用来帮他恢复它的上层方法执行状态。
Java 堆
- Java 堆(Java Heap)是 Java 虚拟机所管理的内存中最大的一块,是线程共享的,在虚拟机启动时创建。
- 此内存区域的唯一目的是为了存放对象实例,几乎所有的对象实例都在这里分配内存。
- Java 堆是垃圾收集器管理的主要区域。
- 从内存回收的角度看,由于现在收集器基本都是采用分代收集算法,所以 Java 堆中还可以细分为:新生代和老生代。
- 如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出 OutOfMemoryError 异常。
方法区
- 方法区(Method Area)是线程共享的内存区域。
- 此内存区域的作用是存储已被虚拟机加载的类信息、常量、静态变量、及时编译器编译后的代码等数据。
- Java 虚拟机规范对这个区域的限制非常宽松,除了和 Java 堆一样不需要连续的内存和可以选择固定大小或可扩展外,还可以选择不实现垃圾收集。
- 当方法区无法满足内存分配需求时,将会抛出 OutOfMemoryError 异常。
运行时常量池
- 运行时常量池(Runtime Constant Pool)是方法区的一部分。
- Class 文件中的常量池信息在类加载后将会存放到方法区的运行时常量池中,一般来说,还会将翻译出来的直接引用也存储在运行时常量池中。
- 运行时常量池相对于 Class 文件常量池的另外一个重要特征是具备动态性,Java 语言并不要求常量一定只能在编译期产生,也就是并非预置入 Class 文件中常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中,这种特性被开发人员利用得比较多的便是 String 类的 intern() 方法。
- 作为方法区的一部分,自然也会受到方法区内存的限制,当常量池无法再申请到内存是会抛出 OutOfMemoryError 异常。