第六章 类文件结构

这章涉及记忆性的东西太多。
下面简要讲一下一些主要的内容,关于属性表的内容则省略,虽然貌似也挺重要,但是这方面的知识点太多。



如图所示Class类文件的结构按照从上往下排序依次也对应着class二进制文件里的顺序。
下面则是书上内容的一些摘要:
6.1 Class文件
  1. Class文件是一组以8字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑地排列在Class文件中,中间没有添加任何分隔符若遇到需要占用8字节以上空间的数据时,则会按照高位在前的方式分割成若干组8位字节进行存储。
  2. Class文件格式采用一种类似于C语言结构体的伪结构来存储,这种结构只有两种数据类型:无符号数和表。

那么无符号数和表又是什么呢?
无符号数属于基本的数据类型,以u1,u2,u4,u8来分别代表1个字节,2个字节,4个字节和8个字节的无符号数,无符号数可以用来描述数字、索引引用、数量值、或者按照UTF-8编码构成字符串值
表是由多个无符号数或其他表作为数据项构成的复合数据类型,所有表都习惯性地以“_info”结尾,整个Class文件本质上就是一张表。

6.2 魔数(magic Number)

Class文件的头4个字节,作用:确定这个文件是否为一个能被虚拟机接受的Class文件。值为:0xCAFEBABE(咖啡宝宝)

这个好理解,比如EXE文件打开前面都也会有一个标记,jpg这些格式也是存在这种标记的。

6.3 版本号

紧接着魔数的4个字节。第5,6字节是次版本号,第7,8字节是主版本号

编译器版本-target参数十六进制版本号十进制版本号
JDK 1.7.0-target 1.600 00 00 3251.0
6.4 常量池

常量池是占用Class文件空间最大的数据项目之一,也是在Class文件中第一个出现的表类型数据项目。其中主要存放两大类常量:字面量(Literal)和符号引用(Symbolic References)
那么字面量(Literal)和符号引用(Symbolic References)又是什么呢?
1.字面量比较接近JAVA语言层面的常量概念,如文本字符串,final常量值
2.符号引用属于编译原理方面的概念,其包含下面三类常量:类和接口的全限定名(Fully Qualified Name)、字段的名称和描述符(Descriptor)、方法的名称和描述符


虽然解释了一下符号引用,那么描述符又是什么呢?
描述符:描述符的作用是用来描述字段的数据类型、方法的参数列表和返回值。
例如: 定义java.lang.String[][]的二维数组江北记录为"[[Ljava/lang/String",一个整形数组 int[]将被记录为"[I"
而方法比如int indexOf(char[] source int start),会被记录为([CI)I
如上面例子基本类型则直接首字母大写即可

6.5 访问标志(access_flag)

用于识别一些类或接口层次的访问信息,包括:这个Class是类还是接口,是否定义为public类型,是否定义为abstract类型,如果是类的话,是否被声明为final,等等。

6.6 类索引、父类索引、接口索引

类索引和父类索引都是一个u2类型的数据,接口索引是一组u2类型的数据,用来指向常量池中的数据

其中类索引和父类索引一直,

接口索引则是一个数组紧跟在interfaces_count一个接口个数的后面,名为interfaces的数组,它包含了对每个由该类或者接口直接实现(注:只包含直接出现在implements、extends子句中的父接口)的父接口的常量池索引。

两个字节为this_class项,它是一个对常量池的索引。在this_class位置的常量池入口必须为CONSTANT_Class_info表。该表由两个部分组成——标签和name_index。标签部分是一个具有CONSTANT_Class值的常量,在name_index位置的常量池入口为一个包含了类或接口全限定名的CONSTANT_Utf8_info表。

如图所示,可以看得清楚一些:
this_class的2个字节指向常量池的CONSTANT_Class_info表,而具体的信息则保持在CONSTANT_Utf8_info表中,在CONSTANT_Class_info有name_index项指向具体的表项。




6.7 字段表(field_info)

字段表用于描述接口或者类中声明的变量。包括类级变量或者实例级变量,但不包括方法内部声明的变量。

标示字符含义
B基本类型byte
C基本类型char
S基本类型short
I基本类型int
F基本类型float
D基本类型double
J基本类型long
Z基本类型boolean
V无返回值的void
L,如com/max/ComputerClass对象类型

对于数组类型的描述,举例(描述符): 
java.lang.String[][] ---> [[Ljava/lang/String;
int[] ---> [I
即每一个维度将使用一个前置的"["字符来描述

首先是名为fields_count的计数,它是类变量和实例变量的字段的数量总和。在这个计数后面的是不同长度的field_info表的序列(fields_count指出了序列中有多少个field_info表)。每个fields_info表包含固定的3个属性,第一个是access_flags他表示字段或者方法的修饰权限,第二个name_index则对应常量池中的字段的简单名字描述,第三个descriptor_index则对应常量池中的描述符。之后还有一个attributes_count和attributes表示属性表,用来存储额外的一些信息,字段则可以存储初始化的一些信息,而方法则指向属性表中的字节码。
在fields列表中,不列出从超类或者父接口继承而来的字段。


6.8 方法表
和字段表很像。

对于方法的描述,举例:
void walk() ---> ()V
java.lang.String toString() ---> ()Ljava/lang/String;
int indexOf(char[] source, int sourceOffset, int sourceCount, char[] target, int targetOffset, int targetCount, int fromIndex) ---> ([CII[CIII)])I
即遵循的规范是:先参数列表,后返回值。参数列表按照参数的严格顺序放在一组小括号"()"之内,数据类型用与之对应的符号来表示。


属性表略。












posted @ 2017-04-05 19:16  _如此甚好  阅读(283)  评论(0编辑  收藏  举报