第六章 类文件结构
6.1 Class文件
- Class文件是一组以8字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑地排列在Class文件中,中间没有添加任何分隔符若遇到需要占用8字节以上空间的数据时,则会按照高位在前的方式分割成若干组8位字节进行存储。
- Class文件格式采用一种类似于C语言结构体的伪结构来存储,这种结构只有两种数据类型:无符号数和表。
那么无符号数和表又是什么呢?
无符号数属于基本的数据类型,以u1,u2,u4,u8来分别代表1个字节,2个字节,4个字节和8个字节的无符号数,无符号数可以用来描述数字、索引引用、数量值、或者按照UTF-8编码构成字符串值
表是由多个无符号数或其他表作为数据项构成的复合数据类型,所有表都习惯性地以“_info”结尾,整个Class文件本质上就是一张表。
6.2 魔数(magic Number)
Class文件的头4个字节,作用:确定这个文件是否为一个能被虚拟机接受的Class文件。值为:0xCAFEBABE(咖啡宝宝)
6.3 版本号
紧接着魔数的4个字节。第5,6字节是次版本号,第7,8字节是主版本号
编译器版本 | -target参数 | 十六进制版本号 | 十进制版本号 |
---|---|---|---|
JDK 1.7.0 | -target 1.6 | 00 00 00 32 | 51.0 |
6.4 常量池
常量池是占用Class文件空间最大的数据项目之一,也是在Class文件中第一个出现的表类型数据项目。其中主要存放两大类常量:字面量(Literal)和符号引用(Symbolic References)
那么字面量(Literal)和符号引用(Symbolic References)又是什么呢?
1.字面量比较接近JAVA语言层面的常量概念,如文本字符串,final常量值
2.符号引用属于编译原理方面的概念,其包含下面三类常量:类和接口的全限定名(Fully Qualified Name)、字段的名称和描述符(Descriptor)、方法的名称和描述符
6.5 访问标志(access_flag)
用于识别一些类或接口层次的访问信息,包括:这个Class是类还是接口,是否定义为public类型,是否定义为abstract类型,如果是类的话,是否被声明为final,等等。
6.6 类索引、父类索引、接口索引
类索引和父类索引都是一个u2类型的数据,接口索引是一组u2类型的数据,用来指向常量池中的数据
其中类索引和父类索引一直,
接口索引则是一个数组紧跟在interfaces_count一个接口个数的后面,名为interfaces的数组,它包含了对每个由该类或者接口直接实现(注:只包含直接出现在implements、extends子句中的父接口)的父接口的常量池索引。
两个字节为this_class项,它是一个对常量池的索引。在this_class位置的常量池入口必须为CONSTANT_Class_info表。该表由两个部分组成——标签和name_index。标签部分是一个具有CONSTANT_Class值的常量,在name_index位置的常量池入口为一个包含了类或接口全限定名的CONSTANT_Utf8_info表。
6.7 字段表(field_info)
字段表用于描述接口或者类中声明的变量。包括类级变量或者实例级变量,但不包括方法内部声明的变量。
标示字符 | 含义 |
---|---|
B | 基本类型byte |
C | 基本类型char |
S | 基本类型short |
I | 基本类型int |
F | 基本类型float |
D | 基本类型double |
J | 基本类型long |
Z | 基本类型boolean |
V | 无返回值的void |
L,如com/max/ComputerClass | 对象类型 |
对于数组类型的描述,举例(描述符):
java.lang.String[][] ---> [[Ljava/lang/String;
int[] ---> [I
即每一个维度将使用一个前置的"["字符来描述
6.8 方法表
对于方法的描述,举例:
void walk() ---> ()V
java.lang.String toString() ---> ()Ljava/lang/String;
int indexOf(char[] source, int sourceOffset, int sourceCount, char[] target, int targetOffset, int targetCount, int fromIndex) ---> ([CII[CIII)])I
即遵循的规范是:先参数列表,后返回值。参数列表按照参数的严格顺序放在一组小括号"()"之内,数据类型用与之对应的符号来表示。