JVM的内存布局

JVM的内存布局包括,其中:

Java虚拟机在执行Java程序的过程中会把它所管理的内存(线程相关?)划分为若干个不同的数据区域。有些区域随着虚拟机进程的启动而存在,有些区域则是依赖用户线程的启动和结束而建立和销毁。根据规范,Java虚拟机所管理的内存包括以下运行时数据区域:

 

方法区 Method Area

Heap

虚拟机栈VM Stack

本地方法栈Natvie Method Stack

程序计数器Program Couter Register

 

 

程序计数器

 

程序计数器是当前线程所执行的字节码的行号指示器。由于Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时刻,一个处理器只会执行一条线程中的指令。因此为了线程切换后能回复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间的计数器互不影响, 独立存储,我们称这类内存区域为“线程私有”的内存。

如果线程正在执行的是一个Java方法,计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是Native方法,这个计数器值为空。程序计数器是唯一一个在JVM规范里没有规定任何OutOfMemoryError情况的区域。

 

Java虚拟机栈

 

与程序计数器一样,JVM栈也是线程私有的,它的生命周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法被执行的时候都会同时创建一个帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法被调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。

 

经常有人把Java内存区分为堆内存和栈内存,这种方法比较粗糙。只能说明大多数程序员最关注的,与对象内存分配关系最密切的内存区域是这两块,其中所指的堆是Java Heap,而“栈”就是现在的JVM栈,或者说是JVM栈中的局部变量表部分。

 

局部变量表存放了编译器可知的各种基本数据类型、对象应用和returnAddress类型(指向了一条字节码指令的地址)。其中reference类型不同于对象本身,根据不同的JVM实现,它可能是一个指向对象起始地址的引用指针,也可能指向一个代表对象的句柄或者与此对象相关的位置。

 

64位长度的long和double类型的数据会占用2个局部变量空间,其他的数据类型只占用一个。局部变量表所需的内存空间在编译期间完成分配,方法运行期间不会改变局部变量表大小。

 

在JVM规范中,对这个区域规定了两种异常情况,如果线程请求的栈深度大于JVM所允许的深度,将抛出StackOverFlowError异常;如果JVM可以动态扩展,当扩展时无法申请到足够多的内存时会抛出OutOfMemoryError异常。

 

本地方法栈(Native Stack)

 

本地方法栈和JVM栈发挥的作用是非常相似的,其区别不过是虚拟机栈为虚拟机执行Java方法(字节码)服务,而本地房发展则是为虚拟机使用到的Native方法服务。

 

Java堆(Java Heap)

 

对于大多数应用来说,Java堆是JVM所管理的内存中最大的一块。Java Heap是被所有线程共享的一块内存区域,在JVM启动时创建。此内存区域的唯一目的就是存放对象实例,几乎所有的对象实例以及数组都在这里分配内存。在JVM规范中的描述是:所有的对象实例以及数组都要在Heap上分配。但是随着JIT编译器的发展以及逃逸分析技术的逐渐成熟,栈上分配 、标量替换优化技术将会导致一些微妙变化发生,所有对象都分配在堆上也渐渐变得不是那么绝对了。

 

Java堆是垃圾收集器管理的主要区域,因此很多时候也被称作GC堆(Garbage Collected Heap)。如果从内存回收的角度看,由于现在的收集器基本都是采用的分代收集算法,所以Java堆中还可以细分为:新生代和老年代;再细致一点的有Eden空间、From Survivor空间、To Survivor空间等。如果从内存分配的角度看,线程共享的Java堆中可能划分出多个线程私有的分配缓冲区(TLAB,Thread Local Allocation Buffer)不过不论如何划分都与存放内容无关,无论哪个区域存储的都是对象实例,进一步划分的目的是为了更好的回收内存,或者更快的分配内存。

 

方法区(Method Area)

 

方法区与Heap一样,是各个线程共享的内存区域,他用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。虽然JVM规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做Non-Heap,目的应该是与Heap区分开来

 

对于习惯在Hotspot虚拟机上开发和部署的开发者来说,很多人愿意把方法区成为“永久代”(Permanent Generation),本质上两者并不等价,仅仅是因为HotSpot虚拟机的设计团队选择把GC分代收集扩展至方法区,或者说使用永久代来实现方法区而已。对于其他虚拟机是不存在永久代的概念的。

 

JVM规范对方法区的限制非常宽松,相对而言垃圾收集行为在这个区域是比较少出现的,但并非数据进入了方法区就如永久代的名字一样永久存在了。这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载,一般来说这个区域的回收成绩难以令人满意,尤其是对类型的卸载条件相当苛刻。在Sun公司的BUG列表中,出现过的若干个严重的BUG就是由于低版本的HotSpot虚拟机对此区域未完全回收导致内存泄露。JVM规范规定当方法区无法满足内存分配需求时,抛出OutOfMemoryError异常。

 

运行时常量池(Runtime Constant Pool)

 

运行时常量池是方法区的一部分,Class文件中除了有类的版本、字段、方法、接口等描述信息以外,还有一项信息是常量池,用于存放编译器生成的各种字面量和符号应用,这部分内容将在类加载后存放到方法区的运行时常量池中。【在编译期被确定,并被保存在已编译的.class文件中的一些数据】

 

对于运行时常量池,JVM规范没有任何细节的要求。一般来说,除了保存Class文件中描述的符号应用外,还会把翻译出来的直接应用也存储在运行是常量池中。

 

RCP相对于Class文件常量池的另一个重要特征是具备动态性,运行期间也可以将新的常量放入池中,如String类的intern()方法。

 

常量池在运行期被JVM装载,并且可以扩充。String的intern()方法就是扩充常量池的一个方法;当一个String实例str调用intern()方法时,Java查找常量池中是否有相同Unicode的字符串常量,如果有,则返回其引用,如果没有,则在常量池中增加一个Unicode等于str的字符串并返回它的引用。

 

<new String()> 是运行期的?

 

既然RCP是方法区的一部分,自然会受到方法区内存的限制,但RCP无法再申请到内存时会抛出OutOfMemoryError异常。

 

直接内存(Direct Memory)

 

直接内存并不是虚拟机运行时数据区第一部分,也不是JVM规范中定义的内存区域,但是这部分内存也被频繁的使用,而且也可能导致OutOfMemoryError异常出现。

 

在JDK中加入了NIO类,引入了一种基于通道与缓冲区的IO方式,它可以使用Native函数库直接分配堆外内存,然后通过一个存储在Java堆里面的DirectByteBuffer对象作为这块内存的引用进行操作。这样能在一些场景中显著提高性能,因为避免了在Java堆和Native堆中来回复制数据。(?)

 

显然DM不会受到Java堆大小的限制,但既然是内存肯定还会受到本机总内存(RAM及SWAP区或者分页文件)的大小以及处理器寻址空间的限制。Admin配置虚拟机参数时,一般会根据实际内存设置-Xmx等参数信息,但经常会忽略掉直接内存,使得各个内存区域的综合大雨物理内存限制,从而出现OutOfMemoryError异常。

 

对象访问

 

由于reference类型在JVM规范里只规定了指向对象的应用,并没有定义这个应用应该通过哪种方式去定位,以及访问到Java堆中的对象的具体位置,不同的虚拟机实现的对象访问方式会有所不同,主流的访问方式有两种:句柄和直接指针。

 

如果是句柄访问方式,Java堆中会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象示例数据和类型数据各自的具体地址信息。

 

如果是直接指针访问方式,Java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息,reference中直接存储的就是对象地址。

 

这两种对象访问方式哥有优势,使用句柄的最大好处是reference中存储的是稳定的句柄地址,在对象被移动时只会改变句柄中的实例数据指针,而reference本身不需要被修改。

 

使用直接指针访问方式的最大好处是速度更快,它节省了一次指针定位的时间开销,Sun HotSpot是使用直接指针访问的。

 

显然DM不会受到Java堆大……

posted on 2013-10-11 18:04  heartstage  阅读(450)  评论(0编辑  收藏  举报

导航