jvm入门及理解(四)——运行时数据区(堆+方法区)
一、堆
定义: Heap,通过new关键字创建的对象,都存放在堆内存中。
特点
- 线程共享,堆中的对象都存在线程安全的问题
- 垃圾回收,垃圾回收机制重点区域。
jvm内存的划分:
- JVM内存划分为堆内存和非堆内存,堆内存分为年轻代(Young Generation)、老年代(Old Generation),非堆内存就一个永久代(Permanent Generation)。
- 年轻代又分为Eden和Survivor区。Survivor区由FromSpace和ToSpace组成。Eden区占大容量,Survivor两个区占小容量,默认比例是8:1:1。
- 非堆内存用途:永久代,也称为方法区,存储程序运行时长期存活的对象,比如类的元数据、方法、常量、属性等。
- 年轻代(New):年轻代用来存放JVM刚分配的Java对象
- 年老代(Tenured):年轻代中经过垃圾回收没有回收掉的对象将被Copy到年老代
- 永久代(Perm):永久代存放Class、Method元信息,其大小跟项目的规模、类、方法的量有关,一般设置为128M就足够,设置原则是预留30%的空间,方法区。
堆内存查看的相关指令:
- jps
查看系统有哪些进程。
- jmap
查看堆内存使用情况 jmap -heap PID
- jconsole
图形界面,多功能检测工具,连续监测
二、方法区
定义: 其中主要存储class文件的信息和运行时常量池,class文件的信息包括类信息和class文件常量池。
class文件结构:
- 最头的4个字节用于存储魔数Magic Number,用于确定一个文件是否能被JVM接受
- 接着4个字节用于存储版本号,前2个字节存储次版本号,后2个存储主版本号
- 再接着是用于存放常量的常量池,由于常量的数量是不固定的,所以常量池的入口放置一个U2类型的数据(constant_pool_count)存储常量池容量计数值、类信息、父类与接口数组、方法信息。
三、常量池、运行时常量池、字符串池
1、常量池:就是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量等信息,我们可以通过Javap -v 类名.class 指令反编译一个简单的程序看到如下的常量池信息
左边“#1”为常量池中的符号地址。
2、运行时常量池:常量池是 class 文件中的,当该类被加载,它的常量池信息就会放入运行时常量池,并把里面的符号地址变为真实地址。
3、字符串池:在JVM里实现字符串池功能的是一个StringTable类,它的底层是一个HashTable,里面存的是字符串对象的引用(而不是字符串实例本身),真正的字符串实例是存放在堆内存中的(并且字符串池在逻辑上是属于运行时常量池的一部分)
4.常量池和字符串池的关系:
下面来看段代码:
public static void main(String[] args) { String s1 = "b"; String s2 = "c"; String str = new String("b"); System.out.println(s1 == str); //false }
然后通过反编译观察字节码文件
说明:在jdk1.8时,最开始编译时字符串都是常量池中的符号,尚未转化为对象,当程序执行时,常量池中的信息都会被加载到运行时常量池中,这才转化成了对象,并且看StringTable中有没有"b","c"对象,如果没有则把 "b" 和 "c" 对象的引用值存入StringTable,真正的对象实例则在堆中;如果有的话则不会存入,这样就避免了重复创建字符串对象。
再来分析String str = new String("b")这行代码:
可以看出,这行代码创建的对象个数因StringTable中有没有“b”对象而异,如果字符串池有“b”,则此时只会创建一个对象:也就是new的一个字符串对象,存放在堆中;如果没有就会创建两个对象,一个是new的对象存放在堆中,一个是“b”字符串常量对象,存放在StringTable中。
下面我们再看一个例子:
public class HelloWorld { public static void main(String []args) { String str1 = "abc"; String str2 = new String("def"); String str3 = "abc"; String str4 = str2.intern(); String str5 = "def"; System.out.println(str1 == str3);//true System.out.println(str2 == str4);//false System.out.println(str4 == str5);//true } }
看到String str3 = "abc"; 解析str3时,在StringTable中寻找“abc”,会发现str1的值已经在stringTable中,所以str3的引用地址和str1相同,不会创建不同的对象,即str1==str3为true;
看到String str4 = str2.intern();我们可以知道,intern()函数返回StringTable中”def”的引用值。因为StringTable中已经有“def”引用值,即返回str2中new出来的“def”在StringTable中的引用值。
StringTable 的位置
jdk6(永久代实现)和jdk8(元空间实现)中方法区的区别,其中最主要的区别是将方法区转移到本地内存中,且常量池分为运行时常量池和字符串常量池;且字符串常量池被留在内存中的堆中。
原因:
- StringTable中存在大量的字符串对象,运行时间增长永久代内存占用过多,且永久代只有在触发FULL GC时才进行垃圾回收,回收频率过慢。
- 转移到堆中可以利用虚拟机在堆内存中频繁的垃圾回收,处理StringTable中对象过多情况。
永久代和元空间内存溢出的区别:
- jdk1.6
- jdk1.8
jdk1.8和jdk1.6中intern()方法的运用
- 1.8 将这个字符串对象尝试放入串池,如果有则并不会放入,如果没有则将该字符串的引用放入串池
- 1.6 将这个字符串对象尝试放入串池,如果有则并不会放入,如果没有会把此对象复制一份,放入串池
总结
- 全局字符串池每个虚拟机只有一个,存储字符串常量的引用值;
- class常量池是java程序编译之后才有的,每个类都有,存放字面值和符号引用常量;
- 运行时常量池是在类加载完之后,常量池内容存储在运行时常量池中,每个类都有一个,且常量池中符号引用转换为直接引用,与全局字符串池中保持一致。
StringTable调优:
- 调整hash表中桶子个数,-XX:StringTableSize=桶个数
- 考虑字符串是否入池
四、直接内存
- 常见于NIO操作中,用于数据缓冲
- 分配回收成本高,但读写能力强
- 不受JVM内存回收管理
直接内存使用前后的对比:
使用前:
说明:
- 因为java无法操作本地文件,在java堆内存中划出java缓冲区;
- 从用户态转移到内核态,本地方法在系统内存中划出一段系统缓冲区,将磁盘文件分部分缓冲到系统缓冲区中,间接的将系统缓冲区中数据传输到java缓冲区中;
- 内核态转到用户态,调用输出流写入操作,将文件copy到另一个位置,循环copy,直到全部复制完成。
使用后:
说明:
- ByteBuffer.allocateDirect(_size),在系统内存中分配直接内存;
- 系统方法和java方法都可以访问直接内存;
- 与不使用直接内存相比,减少了一次从系统缓存区向java缓冲区复制的操作,复制效率成倍上升。
直接内存的回收:
- 使用Unsafe对象实现直接内存的分配回收,回收主要使用的是freeMemory方法
- ByteBuffer类内部,使用了Cleaner(虚引用)来检测ByteBuffer对象,一旦对象被回收,就会由ReferenceHandler线程通过Cleaner的clean对象调用freeMenory来释放直接内存。
- -XX:+DisableExplicitGC 显式的System.gc()显式的垃圾回收 FULL GC,被禁用。
- 因为考虑到系统性能,FULL GC时间够长,会严重影响性能。所以涉及到直接内存的使用,释放内存使用Unsafe.freeMemory,不建议使用System.gc()。