认识Class -- 终于不在怂
引子
本是新年,怎奈新冠肆掠,路上行人,男女老少几乎是全副口罩,形色匆匆;偶尔有一两个裸露口鼻的,估计都是没囤到口罩的,这几天药店几乎都是贴上大字:口罩没货。看着网络上病毒消息满天飞,我也响应在家做贡献的号召。上班时,都是早出晚归,几乎只有早上能看到娃,出门时,娃每次都说:see you tomorrow 。赶上疫情,天天在家带娃,终于可以多多陪伴了;别说,带娃还真比上班费神。想着小时候,特别想有一个玩具小船,动手给娃做了一个,附图一张。把娃带好了,也得思考下学习的事儿。学习java有段时间了,想起之前学习java时,看着Class<?> 这样的符号就怵,不明白其表示的含义,又重读《java编程思想》第14章, 趁着这样的时间好好整理了一下,直面当时的怵。
Class对象
Class<?> - 类的类型,是运行时类型信息,也就是 RTTI - RTTI - RunTime Type Infomation;所谓一切皆对象,类也是一个对象,而类的类型信息,就叫做Class对象。RTTI使得我们可以在运行时发现和使用类型信息。以前觉得RTTI离我很远(java菜鸟),其实多态机制正是因为类对象携带了类的类型信息,在类型转化时可以识别到对象的类型。举个栗子,如下, ChildClassTest向上转型为 SuperClassTest时,丢失了子类类型信息,而运行时,向下转型时,又使用RTTI 获取了实际类型,从而可以正常打印出 ChildClassTest。但是,为什么向上转型丢失类型信息,再向下转型时,可以获取到实际的类型,这要从RTTI 的工作原理说起了。
public class SuperClassTest { } public class ChildClassTest extends SuperClassTest { }
SuperClassTest superClassTest = new ChildClassTest();
PrintTool.print(superClassTest);
#打印
com.hj.tool.klass.ChildClassTest@685f4c2e
RTTI的工作原理
前面的例子中,这种在运行时,确定类的实际类型是虚拟机的动态分派机制。 为啥对象可以找到类型信息呢,因为普通对象是被Class对象创建的,而Class对象包含了类的有关信息。下图为Class对象的加载过程,当我们在创建普通对象时,会先判断此类的Class对象是否加载(每个类都有一个Class对象),如果已经加载,就使用Class对象生成普通对象;如果未加载,就需要通过字节码创建Class对象,再生成普通对象。在虚拟机层面,则是运行时,把变量 new ChildClassTest()的引用存放于 LocalVariableTable 的 slot中,执行print时(其实就是执行toString()方法),实际是执行invokevirtual 指令,找到方法的实际接收者,再执行toString()。而 invokevirtual 解析的过程,根据《深入理解java虚拟机》中的描述过程如下:
1)找到操作数栈顶的第一个元素所指向的对象的实际类型,记作C。 2)如果在类型C中找到与常量中的描述符和简单名称都相符的方法,则进行访问权限校验,如果通过则返回这个方法的直接引用,查找过程结束;如果不通过,则返回java.lang.IllegalAccessError异常。 3)否则,按照继承关系从下往上依次对C的各个父类进行第2步的搜索和验证过程。 4)如果始终没有找到合适的方法,则抛出java.lang.AbstractMethodError异常。 由于invokevirtual指令执行的第一步就是在运行期确定接收者的实际类型,所以两次调用中的invokevirtual指令把常量池中的类方法符号引用解析到了不同的直接引用上,
这个过程就是Java语言中方法重写的本质。我们把这种在运行期根据实际类型确定方法执行版本的分派过程称为动态分派。
Class文件结构
既然Class对象来源于字节码,那就来分析下.class文件的内容,引用《java虚拟机规范》中关于classFile的格式如下:“每个class文件都由字节流组成,每个字节含有8个二进制位。所有16位,32位,64位长度的数据将通过构造成2个,4个,8个连续的8位字节来表示。”规范中定义了每个项的字节长度,以及结构,分析的过程还是挺有意思的:原来我们写的代码都被编译成那样的格式。说来也惭愧,java用了这么久,连一个简单的.class文件都没有分析过。
每个class文件都对应如下结构(JDK 8,不同版本结构不是完全一样),其中包括两类数据类型:u(1/2/4), _info; u 后面的数字表示n个字节,而 每个_info 又有特定的格式。 具体可以参看《java虚拟机规范 se 8》第4章内容。
我们来看下具体的一个类,
package com.hj.tool.klass; /** * @Description TODO * @Author jijunjian * @Date 2020-01-27 20:47 * @Version 1.0 */ public class ByteCodeTest { private int m ; public int inc(){ return m+1; } }
使用xxd ByteCodeTest.class 查看编译后的.class文件(16进制),得到如下内容。乍一看,是不是完全看不到,我们的类是如何组织的哇。等我们按class文件的格式整理后,情况就完全不一样了。
cafe babe 0000 0034 0016 0a00 0400 1209 0003 0013 0700 1407 0015 0100 016d 0100 0149 0100 063c 696e 6974 3e01 0003 2829 5601 0004 436f 6465 0100 0f4c 696e 654e 756d 6265 7254 6162 6c65 0100 124c 6f63 616c 5661 7269 6162 6c65 5461 626c 6501 0004 7468 6973 0100 204c 636f 6d2f 686a 2f74 6f6f 6c2f 6b6c 6173 732f 4279 7465 436f 6465 5465 7374 3b01 0003 696e 6301 0003 2829 4901 000a 536f 7572 6365 4669 6c65 0100 1142 7974 6543 6f64 6554 6573 742e 6a61 7661 0c00 0700 080c 0005 0006 0100 1e63 6f6d 2f68 6a2f 746f 6f6c 2f6b 6c61 7373 2f42 7974 6543 6f64 6554 6573 7401 0010 6a61 7661 2f6c 616e 672f 4f62 6a65 6374 0021 0003 0004 0000 0001 0002 0005 0006 0000 0002 0001 0007 0008 0001 0009 0000 002f 0001 0001 0000 0005 2ab7 0001 b100 0000 0200 0a00 0000 0600 0100 0000 0900 0b00 0000 0c00 0100 0000 0500 0c00 0d00 0000 0100 0e00 0f00 0100 0900 0000 3100 0200 0100 0000 072a b400 0204 60ac 0000 0002 000a 0000 0006 0001 0000 000e 000b 0000 000c 0001 0000 0007 000c 000d 0000 0001 0010 0000 0002 0011
以下是整理后的结果,这个过程还是需要些耐心的。但是这个时间花得决绝物超所值。我解析了大部分内容,基本都注释了,其中常量池占了很多内容,但其实是最简单部分,method中关于code属性是比较麻烦的。不同版本编译得到的内容可能会有不同。
#魔数 cafe babe #版本 jdk 8 0000 0034 # 常量池有21 个,第一个,是保留 0016 # 第一个常量 CONSTANT_Methodref_info{ u1 tag //10 u2 class_index //指向CONSTANT_Class_info;表示类 u2 name_and_type_index //指向CONSTANT_NameAndType,表示方法名、方法描述符 } 0a tag 10 0004 class_index 指向 4 0012 name_and_type_index 指向 18 # 第二个常量 tag=9 CONSTANT_Fieldref_info{ u1 tag //9 u2 class_index //指向CONSTANT_Class_info;既可以表示类、也可以表示接口 u2 name_and_type_index //指向CONSTANT_NameAndType,表示字段名、字段描述符 } 09 tag 9 0003 class_index 指向 3 0013 name_and_type_index 指向19 # 第三个常量 tag=7 CONSTANT_Class_info{ u1 tag //tag=7 u2 name_index // name_index是索引值,指向CONSTANT_Utf8_info } 07 tag 7 0014 name_index 指向 20 com/hj/tool/klass/ByteCodeTest # 第4个常量 tag=7 07 0015 name_index 指向 21 # 第5个常量 tag=01 CONSTANT_Utf8_info{ u1 tag //1 u2 length u1 bytes[length] //长度为length的字符串数组 } 01 tag 0001 length 6d asc 109=m # 第6个常量 tag=01 01 0001 length 49 asc 73 I 表示int # 第7个常量 tag=01 01 0006 3c 69 6e 69 74 3e <init> # 第8个常量 tag=01 utf8 字符串数组 01 0003 28 29 56 ()V # 第9个常量 tag=01 utf8 字符串数组 01 0004 43 6f 64 65 Code # 第10个常量 tag=01 utf8 字符串数组 01 000f length=15 4c 69 6e 65 Line 4e 75 6d 62 65 72 number 54 61 62 6c 65 Table # 第11个常量 tag=01 utf8 字符串数组 01 0012 4c 6f 63 LocalVariableTable 61 6c 56 61 72 69 61 62 6c 65 54 61 62 6c 65 # 第12个常量 tag=01 utf8 字符串数组 01 0004 74 68 69 73 this # 第13个常量 tag=01 utf8 字符串数组 01 0020 4c 63 6f 6d 2f 68 6a 2f 74 6f 6f 6c 2f 6b 6c 61 73 73 2f 42 79 74 65 43 6f 64 65 54 65 73 74 3b Lcom/hj/tool/klass/ByteCodeTest; 3b=; # 第14个常量 tag=01 utf8 字符串数组 01 0003 69 6e 63 inc # 第15个常量 tag=01 utf8 字符串数组 01 0003 28 29 49 ()I # 第16个常量 tag=01 utf8 字符串数组 01 000a 53 6f 75 72 63 65 46 69 6c 65 SourceFile # 第17个常量 tag=01 utf8 字符串数组 01 0011 17个 42 79 74 65 43 6f 64 65 54 65 73 74 2e 6a 61 76 61 ByteCodeTest.java # 第18个常量 tag=12 NameAndType CONSTANT_NameAndType{ u1 tag //12 u2 name_index //指向CONSTANT_Utf8_info,表示名称 u2 descriptor_index //指向CONSTANT_Utf8_info,表示描述符 } 0c tag 12 nameAndType 0007 name_index 指向第7个常量 <init> 0008 descriptor_index 指向第8个常量 ()V # 第19个常量 tag=12 NameAndType 0c 0005 m 0006 I # 第20个常量 tag=01 utf8 字符串数组 01 001e 63 6f 6d 2f 68 6a 2f 74 6f 6f 6c 2f 6b 6c 61 73 73 2f 42 79 74 65 43 6f 64 65 54 65 73 74 com/hj/tool/klass/ByteCodeTest # 第21个常量 tag=01 utf8 字符串数组 01 0010 6a 61 76 61 2f 6c 61 6e 67 2f 4f 62 6a 65 63 74 java/lang/Object access_flags 0021 表示是public ,是1.2以后所以21 类索引,父类索引,接口索引 0003 类索引 2字节 指向第三个常量 class-info 又指向 和指向第20个 com/hj/tool/klass/ByteCodeTest 0004 父类索引 2字节 同理指向 java/lang/Object 0000 接口索引 无 0001 field_count u2 1个 field_info[1] field_info{ u2 access_flags //表示字段的访问权限、属性 u2 name_index //对常量池的索引 u2 descriptor_index //对常量池的索引 u2 attributes_count //附加属性的数量 attribute_info attributes[attributes_count] //每个成员是attribute_info结构 } 0002 private 0005 name_index m 0006 descriptor_index I 0000 attributes_count 0 0002 method_count method_info{ u2 access_flags //表示方法的访问权限、属性 u2 name_index //对常量池的索引 u2 descriptor_index //对常量池的索引 u2 attributes_count//附加属性的数量 attribute_info attributes[attributes_count] //每个成员是attribute_info结构 } # 第一个 method init 0001 access_flags public 0007 name_index <init> 0008 descriptor_index ()V 0001 attributes_count 1 attribute_info{ u2 attribute_name_index //常量池索引 u4 attribute_length u1 info[attribute_length] } 0009 attribute_name_index Code 0000 002f attribute_length 47 0001 max_stack 0001 max_locals 0000 0005 code_attribute_length 2a b7 0001 b100 00 00 02 00 0a 00 00 00 06 00 01 00 00 00 09 00 0b 00 00 00 0c 00 01 00 00 00 05 00 0c 00 0d 00 00 # 第二个method 0001 access_flags public 000e name_index 14 inc 000f descriptor_index 15 ()I 0001 attributes_count 1 attribute_info 0009 attribute_name_index Code 0000 0031 attribute_length 49 00 02 max_stack 00 01 max_locals 一个 00 00 00 07 code_length 7 2a aload_0 将第一个引用类型的本地变量 b4 getfield 获取指定类型的实例字段 m #下面这两个指令没弄明白是啥意思, 00 nop 不做 02 iconst_ml 将-1 推到栈顶 04 iconst_1 将1 推到栈顶 60 iadd 将栈顶两个相加,结果压入栈顶 ac ireturn 返回int 00 00 exception_table_length 00 02 attritutes_count 2 00 0a LineNumberTable 00 00 00 06 length=6 00 01 00 00 00 0e 00 0b LocalVariableTable 00 00 00 0c length =12 00 01 00 00 00 07 00 0c 00 0d 00 00 0001 attributes_count 1 0010 attribute_name_index 16 SourceFile 0000 0002 attribute_length 2 0011 sourcefile_index 17 指向常量池中 ByteCodeTest.java
结语
文章写到这里,感觉非常艰难,一是感觉写得不知所云,估计只有自己能明白,二是感觉自己的理解还很浅显。没动手之前,感觉啥都理解了,真正开始动手吧,又感觉啥都没理解。这便是从输入到输出的真实过程;读只是输入,无法形成真正的理解,只有持续输出才能真正领悟,而这个输出的过程才是消化的过程。写得过程中,又不断翻阅资料,把原来点点的理解,连接成断断续续的线,希望以后可以再深入学习,把这些点点的东西,连成线,汇成面。
成为一名优秀的程序员!
文章参考了很多《jjava编程思想》,《java虚拟机规范 se 8》,《深入理解java虚拟机》第二版中的内容。