第十章 对象的实例化、内存布局与访问定位
上面我们已经讲完了运行时数据区。但道理可以直接讲执行引擎了,但是呢?为了面试(功利上讲),我们再讲下这一节。
从知识体系上讲。我们在写程序时要直面栈、堆、方法区。如果是创建对象,创建的对象是在堆中,对应的Class文件是在方法区中,如果是方法中的局部变量,则该变量是在栈中。那么这三者具体是什么关系呢?
1、对象的实例化
大厂面试题
美团:
- 对象在
JVM
中是怎么存储的? - 对象头信息里面有哪些东西?
蚂蚁金服:
二面:java
对象头里有什么
对象创建方式
- new:最常见的方式(new 对象)、变形1:单例类中调用getInstance的静态类方法(这个构造方法是private,然后通过get调用构造方法),变形2:XXXFactory的静态方法(这个其实也是构造方法私有化,用其它方法暴露构造方法)
- Class的newInstance方法:在JDK9里面被标记为过时的方法,因为只能调用空参构造器,并且权限必须为 public 这个和3一样都是反射方式
- Constructor的newInstance(Xxxx):反射的方式,可以调用空参的,或者带参的构造器,权限没有要求
- 使用clone():不调用任何的构造器,要求当前的类需要实现Cloneable接口中的clone方法。其实是已经有了一个对象,再用这个对象的clone方法克隆出一个对象,是浅复制
- 使用序列化:从文件中,从网络中获取一个对象的二进制流,序列化一般用于Socket的网络传输。
- 第三方库 Objenesis 使用这些第三方库,利用相关字节码技术,动态生成对象。
对象创建步骤:从字节码角度看待对象创建过程
public class ObjectTest { public static void main(String[] args) { Object obj = new Object(); } }
字节码指令
public static void main(java.lang.String[]); descriptor: ([Ljava/lang/String;)V flags: ACC_PUBLIC, ACC_STATIC Code: stack=2, locals=2, args_size=1 0: new #2 // class java/lang/Object 3: dup 4: invokespecial #1 // Method java/lang/Object."<init>":()V 7: astore_1 8: return LineNumberTable: line 9: 0 line 10: 8 LocalVariableTable: Start Length Slot Name Signature 0 9 0 args [Ljava/lang/String; 8 1 1 obj Ljava/lang/Object; }
从字节码角度分析对象创建过程略。
从执行步骤的角度来分析:至于你说6步还是几步都可以。只是这里面涉及的事情都是要有的。
1、判断对象对应的类是否加载、链接、初始化
- 虚拟机遇到一条new指令,首先去检查这个指令的参数能否在Metaspace的常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已经被加载,解析和初始化。(即判断类元信息是否存在)。
- 如果该类没有加载,那么在双亲委派模式下,使用当前类加载器以ClassLoader + 包名 + 类名为key进行查找对应的.class文件,如果没有找到文件,则抛出ClassNotFoundException异常,如果找到,则进行类加载,并生成对应的Class对象。
2、为对象分配内存
- 首先计算对象占用空间的大小,接着在堆中划分一块内存给新对象。如果实例成员变量是引用变量,仅分配引用变量空间即可,即4个字节大小。(比如一个类中有一个int域、String域和Object域,则占16个字节。这个大小非常确定) --- ---- 只是我略微有疑问是对于方法和代码块等怎么办?这些是不是不需要划分。
- 如果内存规整:采用指针碰撞分配内存
- 如果内存是规整的,那么虚拟机将采用的是指针碰撞法(Bump The Point)来为对象分配内存。
- 意思是所有用过的内存在一边,空闲的内存放另外一边,中间放着一个指针作为分界点的指示器,分配内存就仅仅是把指针往空闲内存那边挪动一段与对象大小相等的距离罢了。
- 如果垃圾收集器选择的是Serial ,ParNew这种基于压缩算法的,虚拟机采用这种分配方式。一般使用带Compact(整理)过程的收集器时,使用指针碰撞。
- 标记压缩(整理)算法会整理内存碎片,堆内存一存对象,另一边为空闲区域
- 如果内存不规整
- 如果内存不是规整的,已使用的内存和未使用的内存相互交错,那么虚拟机将采用的是空闲列表来为对象分配内存。
- 意思是虚拟机维护了一个列表,记录上哪些内存块是可用的,再分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的内容。这种分配方式成为了 “空闲列表(Free List)”
- 选择哪种分配方式由Java堆是否规整所决定,而Java堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定
- 标记清除算法清理过后的堆内存,就会存在很多内存碎片。
3、处理并发问题 --- 有些人把这一块和第二块放在一起。堆是多个线程共享的,因此会有线程安全问题。下面是两种解决策略
- 采用CAS+失败重试保证更新的原子性
- 每个线程预先分配TLAB - 通过设置 -XX:+UseTLAB参数来设置(区域加锁机制) 在Eden区给每个线程分配一块区域
4、初始化分配到的空间 ---- 这个说的直白点就是对兑现管道属性初始化(应该就是非静态变量,至于非静态常量我还不知道是不是在这里)。而静态变量和常量都不在这里。
-
所有属性设置默认值,保证对象实例字段在不赋值可以直接使用
-
给对象属性赋值的顺序(下面三个也算是对对象的属性赋值的操作了:1、默认初始化;2、显式初始化\3、代码块中初始化;4、构造器中初始化;5、当然你也可以在对象创建好后,调用方法进行设置属性值,这就不在我们讲的对象初始化范围了。):
- 属性的默认值初始化
- 显示初始化/代码块初始化(并列关系,谁先谁后看代码编写的顺序)
- 构造器初始化
5、设置对象的对象头
将对象的所属类(即类的元数据信息)、对象的HashCode和对象的GC信息、锁信息等数据存储在对象的对象头中。这个过程的具体设置方式取决于JVM实现。
6、执行init方法进行初始化 -- 这里才是真正的初始化吧,执行上面的2和3
-
在Java程序的视角看来,初始化才正式开始。初始化成员变量,执行实例化代码块,调用类的构造方法,并把堆内对象的首地址赋值给引用变量
-
因此一般来说(由字节码中跟随invokespecial指令所决定),new指令之后会接着就是执行init方法,把对象按照程序员的意愿进行初始化,这样一个真正可用的对象才算完成创建出来。
从字节码角度看init方法 下面这个代码就包含了显示初始化\代码块初始化和构造器初始化
/** * 测试对象实例化的过程 * ① 加载类元信息 - ② 为对象分配内存 - ③ 处理并发问题 - ④ 属性的默认初始化(零值初始化) * - ⑤ 设置对象头的信息 - ⑥ 属性的显式初始化、代码块中初始化、构造器中初始化 * * * 给对象的属性赋值的操作: * ① 属性的默认初始化 - ② 显式初始化 / ③ 代码块中初始化 - ④ 构造器中初始化 */ public class Customer{ int id = 1001; String name; Account acct; { name = "匿名客户"; } public Customer(){ acct = new Account(); } } class Account{ }
Customer类的字节码
0 aload_0 1 invokespecial #1 <java/lang/Object.<init>> 4 aload_0 5 sipush 1001 8 putfield #2 <com/atguigu/java/Customer.id> 11 aload_0 12 ldc #3 <匿名客户> 14 putfield #4 <com/atguigu/java/Customer.name> 17 aload_0 18 new #5 <com/atguigu/java/Account> 21 dup 22 invokespecial #6 <com/atguigu/java/Account.<init>> 25 putfield #7 <com/atguigu/java/Customer.acct> 28 return
init() 方法的字节码指令:
- 属性的默认值初始化:
id = 1001;
- 显示初始化/代码块初始化:
name = "匿名客户";
- 构造器初始化:
acct = new Account();
2、对象的内存布局
我们知道new出来的对象是放在堆空间中的,那这个在堆空间中的对象到底是怎样的结构呢?我们这里好好分析一下。
运行时元数据(Mark Word)中的内容:哈希值:创建的对象是在堆空间的,其有一个首地址,这个地址要被调用的方法的栈帧的局部变量表中保存,指向堆空间。GC分代年龄:前面我们说堆空间的对象放在Eden区进行垃圾回收,如果没有回收进入Survivor区。然后会有一个GC值,默认满15则进入老年代,就是年龄计数器。锁状态标志:同步的时候他是不是个锁啊。线程持有的锁:。。。
类型指针:这个类型指针指向元空间(方法区)中所属的类型。我们知道一个对象通过调用getClass就可以知道是哪个类调用的,就是这个指针在起作用。顺便说一句,并不是所有的对象都保存有类型指针。
实例数据:这个很好说,每个对象都有自己的属性还有从父类继承过来的。
内存布局总结
public class Customer{ int id = 1001; String name; Account acct; { name = "匿名客户"; } public Customer(){ acct = new Account(); } public static void main(String[] args) { Customer cust = new Customer(); } } class Account{ }
该图是对应上面这个程序的
上面这个图相对比较清晰了。main方法执行,首先这个栈中就有了main的栈帧,由于是非静态方法,局部变量表中是args和cust(没有this)。当然这个cust指向堆空间创建的Customer对象。然后就是这个对象里面的内容了,非常清晰。
3、对象的访问定位
JVM是如何通过栈帧中的对象引用访问到其内部的对象实例呢? 也就是上面cust属性(在局部变量表中)是怎么定位到堆中的对象的
定位,通过栈上reference访问
对象的两种访问方式:句柄访问和直接指针
1、句柄访问
- 缺点:在堆空间中开辟了一块空间作为句柄池,句柄池本身也会占用空间;通过两次指针访问才能访问到堆中的对象,效率低
- 优点:reference中存储稳定句柄地址,对象被移动(垃圾收集时移动对象很普遍,即下图中实例池中的对象实例数据的位置移动)时只会改变句柄中实例数据指针即可,reference本身不需要被修改,当然此时句柄池中的到对象实例数据的指针就要变化了。
在堆空间开辟了一块区域,这块区域叫句柄池。一个对象就有一个句柄,一个句柄有两个信息。一个是到对象实例数据的指针,一个是到对象类型数据的指针。
2、直接指针(HotSpot采用)
- 优点:直接指针是局部变量表中的引用,直接指向堆中的实例,在对象实例中有类型指针,指向的是方法区中的对象类型数据
- 缺点:对象被移动(垃圾收集时移动对象很普遍)时需要修改 reference 的值
这个直接引用是栈帧中的局部变量表中的reference(对象引用),直接指向了堆空间的实例,然后再这个对象中有一个类型指针,指向对象类型数据。这个是上面我们讲的情况。Hotspot就是采用这种方式。