class字节码结构(四)(方法集合的结构)

《Java虚拟机原理图解》1.5、 class文件中的方法表集合--method方法在class文件中是怎样组织的

一个类有多个方法,所以方法肯定是一个集合。

目标是:

1,了解方法在字节码中结构,在字节码中的位置。

2,了解方法体会怎样被编译成机器指令

3,开发环境是如何根据字节码产生代码提示功能。

 

1,方法位置和结构:计数器和方法信息集合

2,方法信息包括那些内容:

这些信息对应的方法信息结构和字段的结构类似:

这些内容包括:

访问标志(access_flags):记录这个方法的作用域、静态or非静态、可变性、是否可同步、是否本地方法、是否抽象等信息,实际上不止这些信息(略)
名称索引(name_index):名字的索引对应CONSTANT_Utf8_info格式的常量池项,里面存储着“methodName”字符串。
描述索引(descriptor_index):是这个方法签名的索引。签名是由若干个参数的数据类型和返回值的数据类型共同构成的。
常量池的格式为:(参数数据类型描述列表)返回值数据类型 。 属性表(attribute_info)集合:主要存放是方法体编译后的机器指令和方法抛出的异常信息。属性集合是由不同类型的属性组合成的。

访问标志通过2个字节表示,字节的每一位具有特定的含义。

 

侧重说下:属性表集合:

属性表集合记录了某个方法的一些属性信息,这些信息包括:
1,这个方法的代码实现,即方法的可执行的机器指令
2,这个方法声明的要抛出的异常信息
3,这个方法是否被@deprecated注解表示(有点疑问,这个不是可以放在访问标志中)
4,这个方法是否是编译器自动生成的(有点疑问,这个不是可以放在在访问标志中)

 属性集合是分类型的,每个元素代表一种类型:分别对应不同的属性名称。

Code类型的属性表(也就是属性值的内容主要是方法体的机器指令,还有其他信息):

主要是机器指令,异常处理(捕获的异常如何处理),code属性值还有2个属性项(用来记录指令对应的行号;记录方法参数的名字)

下面是Code属性表的组成部分详细说明:

机器指令----code:
目前的JVM使用一个字节表示机器操作码,即对JVM底层而言,它能表示的机器操作码不多于2的 8 次方,即 256个。

异常处理跳转信息---exception_table:
记录try{}块内的机器指令的地址范围和对应的catch{}块中的起始机器指令地址,
当运行时在try块中有异常抛出的话,JVM会将catch{}块对应指令地址传递给PC寄存器,从而实现指令跳转; Java源码行号和机器指令的对应关系
---LineNumberTable属性表: 编译器会将源码中的语句行号跟编译好的机器指令关联起来,如果抛出异常,知道多少行有问题。默认情况下,编译器会生成这一项信息。
可以使用
-g:none 或-g:lines来取消或者要求设置这一项信息。如果使用了-g:none来生成class文件,class文件中将不会有LineNumberTable属性表, 造成的影响就是:1,代码报错,将无法定位错误信息报错的行;2,如果项调试代码,将不能在此类中打断点(因为没有指定行号。) 局部变量表描述信息----LocalVariableTable属性表: 记录的源码中方法参数的名称(即局部变量的名称),如果没有这个属性,字节码的变量名称可能就是a,b,c,d之类的。 默认情况下不会生成到class文件中。你可以根据javac指令的-g:none或者-g:vars选项来取消或者设置这一项信息。

有没有LocalVariableTable属性体现在哪个方面(造成可读性比较差):

1,反编译后看到的变量名字是没有具体意义的字母(比如 arg1,arg0,)

2,开发环境代码提供功能,显示的方法参数的名字是没有具体意义的字母。

 

对上面整个code属性结构的一个说明:

1. attribute_name_index,属性名称索引,占有2个字节,其内的值指向了常量池中的某一项,该项表示字符串“Code”;
2. attribute_length,属性长度,占有 4个字节,其内的值表示后面有多少个字节是属于此Code属性表的;
3. max_stack,操作数栈深度的最大值,占有 2 个字节,
在方法执行的任意时刻,操作数栈都不应该超过这个值,虚拟机的运行的时候,会根据这个值来设置该方法对应的栈帧(Stack Frame)中的操作数栈的深度;
4. max_locals,最大局部变量数目,占有 2个字节,其内的值表示局部变量表所需要的存储空间大小; 5. code_length,机器指令长度,占有 4 个字节,表示跟在其后的多少个字节表示的是机器指令; 6. code,机器指令区域,该区域占有的字节数目由 code_length中的值决定。JVM最底层的要执行的机器指令就存储在这里; 7. exception_table_length,显式异常表长度,占有2个字节,
如果在方法代码中出现了try{} catch()形式的结构,该值不会为空,紧跟其后会跟着若干个exception_table结构体,以表示异常捕获情况; 8. exception_table,显式异常表,占有8 个字节,start_pc,end_pc,handler_pc中的值都表示的是PC计数器中的指令地址。
exception_table表示的意思是:如果字节码从第start_pc行到第end_pc行之间出现了catch_type所描述的异常类型,那么将跳转到handler_pc行继续处理。
9. attribute_count,属性计数器,占有 2 个字节,表示Code属性表的其他属性的数目 10. attribute_info,表示Code属性表具有的属性表,它主要分为两个类型的属性表:“LineNumberTable”类型和“LocalVariableTable”类型。 “LineNumberTable”类型的属性表记录着Java源码和机器指令之间的对应关系 “LocalVariableTable”类型的属性表记录着局部变量描述

关于构造方法的生成:

如果我们在类中没有定义实例化构造方法,JVM编译器在将源码编译成class文件时,
会自动地为这个类添加一个不带参数的实例化构造方法,
JVM对所有的类实例化构造方法名采用了相同的名称:“<init>”。

补充:

如果我们在类中使用到了static修饰的代码块,那么,JVM会在class文件中生成一个“<cinit>()”构造方法。

 

一个方法的例子:

package com.louis.jvm;  
public class Simple {  
    public static synchronized final void greeting(){  
        int a = 10;  
    }  }  

生成字节码过程中会自动生成无参构造器:

public Simple(){  
        super();  
    } 

下面是构造器的字节码结构:

1. 方法访问标志(access_flags): 占有 2个字节,值为0x0001,即标志位的第 16 位为 1,所以该<init>()方法的修饰符是:ACC_PUBLIC;
2. 名称索引(name_index): 占有 2 个字节,值为 0x0004,指向常量池的第 4项,该项表示字符串“<init>”,即该方法的名称是“<init>”; 3.描述符索引(descriptor_index): 占有 2 个字节,值为0x0005,指向常量池的第 5 项,该项表示字符串“()V”,
即表示该方法不带参数,并且无返回值(构造函数确实也没有返回值);
4. 属性计数器(attribute_count): 占有 2 个字节,值为0x0001,表示该方法表中含有一个属性表,后面会紧跟着一个属性表; 5. 属性表的名称索引(attribute_name_index):占有 2 个字节,值为0x0006,
指向常量池中的第6 项,该项表示字符串“Code”,表示这个属性表是Code类型的属性表;
6. 属性长度(attribute_length):占有4个字节,值为0x0000 0011,即十进制的 17,表明后续的 17 个字节可以表示这个Code属性表的属性信息; 7. 操作数栈的最大深度(max_stack):占有2个字节,值为0x0001,表示栈帧中操作数栈的最大深度是1; 8. 局部变量表的最大容量(max_variable):占有2个字节,值为0x0001, JVM在调用该方法时,根据这个值设置栈帧中的局部变量表的大小; 9. 机器指令数目(code_length):占有4个字节,值为0x0000 0005,表示后续的5 个字节 0x2A0xB70x000x01、0xB1表示机器指令; 10.机器指令集(code[code_length]):这里共有 5个字节,值为0x2A 、0xB70x000x010xB1
11. 显式异常表集合(exception_table_count): 占有2 个字节,值为0x0000,表示方法中没有需要处理的异常信息;
12. Code属性表的属性表集合(attribute_count): 占有2 个字节,值为0x0000,表示它没有其他的属性表集合,
因为我们使用了-g:none 禁止编译器生成Code属性表的 LineNumberTable 和LocalVariableTable;

使用javap -v Simple > Simple.txt,查看二进制对应的字节码显示:

JVM的机器指令中的操作码(Opcode)规定只用1个字节表示,所以JVM的指令最多不超过256 个。
第一个字节 0x2A 对应的操作是"aload_0",作用是将第一个引用类型局部变量推送至栈顶;
第二个字节 0xB7,0xB7 对应的操作是:"invokespecial",作用是调用超类构造方法、实例初始化方法或私有方法;
它带有2个字节的参数,即后面的 0x000x01 是它的参数,这个参数是某个常量池中的索引,指向了常量池的第一项,
该项表示一个方法引用项CONSTANT_Methodref_info结构体,表示java.lang.Object 类中的<init>()方法,
即 java/lang/Object."<init>":()V。这条指令的意思就是调用父类Object的构造方法<init>(); 第5个字符是0xB1 ,对应操作是:“Ireturn”,作用是表示无返回值的方法返回,结束方法调用,这条语句放在方法的机器码最后,表示方法结束调用,返回。

Simple.class 中的greeting() 方法的结构:

 

1. 方法访问标志(access_flags): 占有 2个字节,值为 0x0039 ,即二进制的00000000 00111001,即标志位的第11、1213、16位为1,
根据上面讲的方法标志位的表示,可以得到该greeting()方法的修饰符有:ACC_SYNCHRONIZED、ACC_FINAL、ACC_STATIC、ACC_PUBLIC;
2. 名称索引(name_index): 占有 2 个字节,值为 0x0007,指向常量池的第 7 项,该项表示字符串“greeting”,即该方法的名称是“greeting”; 3. 描述符索引(descriptor_index): 占有 2 个字节,值为0x0005,指向常量池的第 5 项,该项表示字符串“()V”,即表示该方法不带参数,并且无返回值; 4. 属性计数器(attribute_count): 占有 2 个字节,值为0x0001,表示该方法表中含有一个属性表,后面会紧跟着一个属性表; 5. 属性表的名称索引(attribute_name_index):占有 2 个字节,值为0x0006,指向常量池中的第6 项,该项表示字符串“Code”,表示这个属性表是Code类型的属性表; 6. 属性长度(attribute_length):占有4个字节,值为0x0000 0010,即十进制的16,表明后续的16个字节可以表示这个Code属性表的属性信息; 7. 操作数栈的最大深度(max_stack):占有2个字节,值为0x0001,表示栈帧中操作数栈的最大深度是1; 8. 局部变量表的最大容量(max_variable):占有2个字节,值为0x0001, JVM在调用该方法时,根据这个值设置栈帧中的局部变量表的大小; 9. 机器指令数目(code_length):占有4 个字节,值为0x0000 0004,表示后续的4个字节0x10、 0x0A0x3B、0xB1的是表示机器指令; 10.机器指令集(code[code_length]):这里共有4 个字节,值为0x10、 0x0A0x3B0xB111.显式异常表集合(exception_table_count): 占有2 个字节,值为0x0000,表示方法中没有需要处理的异常信息; 12.Code属性表的属性表集合(attribute_count): 占有2 个字节,值为0x0000,表示它没有其他的属性表集合,
因为我们使用了-g:none 禁止编译器生成Code属性表的 LineNumberTable 和LocalVariableTable;

重点说下:机器指令,字节码如下:

第一个字节 0x10 对应的操作是"bipush"," 作用是将单字节的常量值(-128~127) 推送至栈顶,它要求一个参数,
后面的 0x0A 即是需要推送到栈顶的单字节,
注意这里的 0x0A 是16进制,就是我们在代码里写的
"a=10"中的10。 第三个字节"3B",“3B”对应的操作是:"istore_0",作用是将栈顶int 型数值存入第一个局部变量。
我们在greeting() 方法中就声明了一个局部变量a,
JVM的运行的时候,将这个局部变量a解析,并放置到局部变量表中的第一个位置;

上述的0x10 0x0A 指令已经将0x0A 推送到了栈顶了,然后 0x3B指令便将栈顶的0x0A 取出,赋值给局部变量表中的第一个参数,即局部变量a, 这样就完成了对局部变量a的赋值;
接着第4个字符是0xB1 ,对应操作是:“Ireturn”,作用是表示无返回值的方法返回,结束方法调用,这条语句放在方法的机器码最后,表示方法结束调用,返回。

总结:

1,对于局部变量的值就放在->字节的方法集合中的->code属性值中的->机器指令中

2,对于局部变量,是根据位置来区别的,指令中没有具体的名字(如果要有需要用到LocalVariableTable属性)

 

Exceptions类型的属性表----method方法声明的要抛出的异常信息:

注意,异常类型的属性和code类型中异常信息是有区别的:

code类型中的异常是:方法中捕获异常及如何处理。
这里的异常属性表是:方法上主动抛出了什么异常的信息。

 例子:

package com.louis.jvm;  
public interface Interface {  
    public  void sayHello() throws Exception;  
} 

如上图所示,Exceptions类型的属性表(attribute_info)结构体由一下元素组成:
属性名称索引(attribute_name_index):占有 2个字节,其中的值指向了常量池中的表示"Exceptions"字符串的常量池项;
属性长度(attribute_length):它比较特殊,占有4个字节,它的值表示跟在其后面多少个字节表示异常信息;
异常数量(number_of_exceptions):占有2 个字节,它的值表示方法声明抛出了多少个异常,即表示跟在其后有多少个异常名称索引;
异常名称索引(exceptions_index_table):占有2个字节,它的值指向了常量池中的某一项,该项是一个CONSTANT_Class_info类型的项,
表示这个异常的完全限定名称;

属性长度问题:

如果某个方法定义中,没有声明抛出异常,那么,表示该方法的方法表(method_info)结构体中的属性表集合中不会有Exceptions类型的属性表;
换句话说,如果方法声明了要抛出的异常,方法表(method_info)结构体中的属性表集合中必然会有Exceptions类型的属性表,并且该属性表中的异常数量不小于1。 我们假设异常数量中的值为 N,那么后面的异常名称索引的数量就为N,它们总共占有的字节数为N
*2,而异常数量占有2个字节,
那么将有下面的这个关系式: 属性长度(attribute_length)中的值
= 2 + 2*异常数量(number_of_exceptions)中的值 Exceptions类型的属性表(attribute_info)的长度=2+4+属性长度(attribute_length)中的值

二进制和字节码结构:

由于sayHello()方法是在的Interface接口类中声明的,它没有被实现,所以它对应的方法表(method_info)结构体中的属性表集合中没有Code类型的属性表。
注:
1. 方法计数器(methods_count)中的值为0x0001,表明其后的方法表(method_info)就一个,
即我们就定义了一个方法,其后会紧跟着一个方法表(method_info)结构体;
2. 方法的访问标志(access_flags)的值是0x0401,二进制是00000100 00000001,第6位和第16位是1,
对应上面的标志位信息,可以得出它的访问标志符有:ACC_ABSTRACT、ACC_PUBLIC。
细心的读者可能会发现,在上面声明的sayHello()方法中并没有声明为abstract类型啊。确实如此,
这是因为编译器对于接口内声明的方法自动加上ACC_ABSTRACT标志。
3. 名称索引(name_index)中的值为0x0005,0x0005指向了常量池的第5项,第五项表示的字符串为“sayHello”,即表示的方法名称是sayHello 4. 描述符索引(descriptor_index)中的值为0x0006,0x0006指向了常量池中的第6项,第6项表示的字符串为“()V” 表示这个方法的无入参,返回值为void类型 5. 属性表计数器(attribute_count)中的值为0x0001,表示后面的属性表的个数就1个,后面紧跟着一个attribute_info结构体; 6. 属性表(attribute_info)中的属性名称索引(attribute_name_index)中的值为0x0007,0x0007指向了常量池中的第7 项,
第 7项指向字符串“Exceptions”,即表示该属性表表示的异常信息;
7. 属性长度(attribute_length)中的值为:0x00000004,即后续的4个字节将会被解析成属性值; 8. 异常数量(number_of_exceptions)中的值为0x0001,表示这个方法声明抛出的异常个数是1个; 9.异常名称索引(exception_index_table)中的值为0x0008,指向了常量池中的第8项,
第8项表示的是CONSTANT_Class_info类型的常量池项,表示“java/lang/Exception”,即表示此方法抛出了java.lang.Exception异常。

补充:局部变量的值存放位置:(查看字节码是以机器指令的方式在code属性中)

code属性结构中还有个局部变量表记录局部变量一些信息:Java字节码浅析(—)

LocalVariableTable:
        Start  Length  Slot  Name   Signature
          0      1      1     i         I

 

posted @ 2018-01-26 11:20  假程序猿  阅读(290)  评论(0编辑  收藏  举报