【JVM】字节码指令集、方法执行、方法调用细节

JVM方法调用和方法执行

字节码指令集(字典)

Java虚拟机的指令由一个字节长度的、代表着某种特定操作含义的数字(称为操作码)以及跟随其后的零至多个代表此操作所需参数(称为操作数而构成

比如:

字节 码 助记符 指令含义
0x00 nop 什么都不做
0x01 aconst_null 将 null 推送至栈顶
0x02 iconst_m1 将 int 型 -1 推送至栈顶
0x03 iconst_0 将 int 型 0 推送至栈顶
0x04 iconst_1 将 int 型 1 推送至栈顶
0x05 iconst_2 将 int 型 2 推送至栈顶
0x06 iconst_3 将 int 型 3 推送至栈顶
0x07 iconst_4 将 int 型 4 推送至栈顶
0x08 iconst_5 将 int 型 5 推送至栈顶
0x09 lconst_0 将 long 型 0 推送至栈顶
0x0a lconst_1 将 long 型 1 推送至栈顶
0x0b fconst_0 将 float 型 0 推送至栈顶
0x0c fconst_1 将 float 型 1 推送至栈顶
0x0d fconst_2 将 float 型 2 推送至栈顶
0x0e dconst_0 将 double 型 0 推送至栈顶
0x0f dconst_1 将 double 型 1 推送至栈顶
0x10 bipush 将单字节的常量值(Byte.MIN_VALUE ~ Byte.MAX_VALUE,即 -128~127)推送至栈顶
0x11 sipush 将短整型的常量值(Short.MIN_VALUE ~ Short.MAX_VALUE,即 -32768~32767)推送至栈顶
0x12 ldc 将 int、float 或 String 型常量值从常量池中推送至栈顶
0x13 ldc_w 将 int、float 或 String 型常量值从常量池中推送至栈顶 (宽索引)
0x14 ldc2_w 将 long 或 double 型常量值从常量池中推送至栈顶(宽索 引)
0x15 iload 将指定的 int 型局部变量推送至栈顶
0x16 lload 将指定的 long 型局部变量推送至栈顶
0x17 fload 将指定的 float 型局部变量推送至栈顶
0x18 dload 将指定的 double 型局部变量推送至栈顶
字节 码 助记符 指令含义
0x19 aload 将指定的 引用 型局部变量推送至栈顶
0x1a iload_0 将第一个 int 型局部变量推送至栈顶
0x1b iload_1 将第二个 int 型局部变量推送至栈顶
0x1c iload_2 将第三个 int 型局部变量推送至栈顶
0x1d iload_3 将第四个 int 型局部变量推送至栈顶
0x1e lload_0 将第一个 long 型局部变量推送至栈顶
0x1f lload_1 将第二个 long 型局部变量推送至栈顶
0x20 lload_2 将第三个 long 型局部变量推送至栈顶
0x21 lload_3 将第四个 long 型局部变量推送至栈顶
0x22 fload_0 将第一个 float 型局部变量推送至栈顶
0x23 fload_1 将第二个 float 型局部变量推送至栈顶
0x24 fload_2 将第三个 float 型局部变量推送至栈顶
0x25 fload_3 将第四个 float 型局部变量推送至栈顶
0x26 dload_0 将第一个 double 型局部变量推送至栈顶
0x27 dload_1 将第二个 double 型局部变量推送至栈顶
0x28 dload_2 将第三个 double 型局部变量推送至栈顶
0x29 dload_3 将第四个 double 型局部变量推送至栈顶
0x2a aload_0 将第一个 引用 型局部变量推送至栈顶
0x2b aload_1 将第二个 引用 型局部变量推送至栈顶
0x2c aload_2 将第三个 引用 型局部变量推送至栈顶
0x2d aload_3 将第四个 引用 型局部变量推送至栈顶
0x2e iaload 将 int 型数组指定索引的值推送至栈顶
0x2f laload 将 long 型数组指定索引的值推送至栈顶
0x30 faload 将 float 型数组指定索引的值推送至栈顶
0x31 daload 将 double 型数组指定索引的值推送至栈顶
0x32 aaload 将 引用 型数组指定索引的值推送至栈顶
0x33 baload 将 boolean 或 byte 型数组指定索引的值推送至栈顶
0x34 caload 将 char 型数组指定索引的值推送至栈顶
0x35 saload 将 short 型数组指定索引的值推送至栈顶
0x36 istore 将栈顶 int 型数值存入指定局部变量
字节 码 助记符 指令含义
0x37 lstore 将栈顶 long 型数值存入指定局部变量
0x38 fstore 将栈顶 float 型数值存入指定局部变量
0x39 dstore 将栈顶 double 型数值存入指定局部变量
0x3a astore 将栈顶 引用 型数值存入指定局部变量
0x3b istore_0 将栈顶 int 型数值存入第一个局部变量
0x3c istore_1 将栈顶 int 型数值存入第二个局部变量
0x3d istore_2 将栈顶 int 型数值存入第三个局部变量
0x3e istore_3 将栈顶 int 型数值存入第四个局部变量
0x3f lstore_0 将栈顶 long 型数值存入第一个局部变量
0x40 lstore_1 将栈顶 long 型数值存入第二个局部变量
0x41 lstore_2 将栈顶 long 型数值存入第三个局部变量
0x42 lstore_3 将栈顶 long 型数值存入第四个局部变量
0x43 fstore_0 将栈顶 float 型数值存入第一个局部变量
0x44 fstore_1 将栈顶 float 型数值存入第二个局部变量
0x45 fstore_2 将栈顶 float 型数值存入第三个局部变量
0x46 fstore_3 将栈顶 float 型数值存入第四个局部变量
0x47 dstore_0 将栈顶 double 型数值存入第一个局部变量
0x48 dstore_1 将栈顶 double 型数值存入第二个局部变量
0x49 dstore_2 将栈顶 double 型数值存入第三个局部变量
0x4a dstore_3 将栈顶 double 型数值存入第四个局部变量
0x4b astore_0 将栈顶 引用 型数值存入第一个局部变量
0x4c astore_1 将栈顶 引用 型数值存入第二个局部变量
0x4d astore_2 将栈顶 引用 型数值存入第三个局部变量
0x4e astore_3 将栈顶 引用 型数值存入第四个局部变量
0x4f iastore 将栈顶 int 型数值存入指定数组的指定索引位置
0x50 lastore 将栈顶 long 型数值存入指定数组的指定索引位置
0x51 fastore 将栈顶 float 型数值存入指定数组的指定索引位置
0x52 dastore 将栈顶 double 型数值存入指定数组的指定索引位置
0x53 aastore 将栈顶 引用 型数值存入指定数组的指定索引位置
0x54 bastore 将栈顶 boolean 或 byte 型数值存入指定数组的指定索引位置
字节 码 助记符 指令含义
0x55 castore 将栈顶 char 型数值存入指定数组的指定索引位置
0x56 sastore 将栈顶 short 型数值存入指定数组的指定索引位置
0x57 pop 将栈顶数值弹出(数值不能是 long 或 double 类型的)
0x58 pop2 将栈顶的一个(对于 long 或 double 类型)或两个数值(对 于非 long 或 double 的其他类型)弹出
0x59 dup 复制栈顶数值并将复制值压入栈顶
0x5a dup_x1 复制栈顶数值并将两个复制值压入栈顶
0x5b dup_x2 复制栈顶数值并将三个(或两个)复制值压入栈顶
0x5c dup2 复制栈顶一个(对于 long 或 double 类型)或两个数值(对 于非 long 或 double 的其他类型)并将复制值压入栈顶
0x5d dup2_x1 dup_x1 指令的双倍版本
0x5e dup2_x2 dup_x2 指令的双倍版本
0x5f swap 将栈最顶端的两个数值互换(数值不能是 long 或 double 类 型)
0x60 iadd 将栈顶两 int 型数值相加并将结果压入栈顶
0x61 ladd 将栈顶两 long 型数值相加并将结果压入栈顶
0x62 fadd 将栈顶两 float 型数值相加并将结果压入栈顶
0x63 dadd 将栈顶两 double 型数值相加并将结果压入栈顶
0x64 isub 将栈顶两 int 型数值相减并将结果压入栈顶
0x65 lsub 将栈顶两 long 型数值相减并将结果压入栈顶
0x66 fsub 将栈顶两 float 型数值相减并将结果压入栈顶
0x67 dsub 将栈顶两 double 型数值相减并将结果压入栈顶
0x68 imul 将栈顶两 int 型数值相乘并将结果压入栈顶
0x69 lmul 将栈顶两 long 型数值相乘并将结果压入栈顶
0x6a fmul 将栈顶两 float 型数值相乘并将结果压入栈顶
0x6b dmul 将栈顶两 double 型数值相乘并将结果压入栈顶
0x6c idiv 将栈顶两 int 型数值相除并将结果压入栈顶
0x6d ldiv 将栈顶两 long 型数值相除并将结果压入栈顶
0x6e fdiv 将栈顶两 float 型数值相除并将结果压入栈顶
0x6f ddiv 将栈顶两 double 型数值相除并将结果压入栈顶
0x70 irem 将栈顶两 int 型数值作取模运算并将结果压入栈顶
字节 码 助记符 指令含义
0x71 lrem 将栈顶两 long 型数值作取模运算并将结果压入栈顶
0x72 frem 将栈顶两 float 型数值作取模运算并将结果压入栈顶
0x73 drem 将栈顶两 double 型数值作取模运算并将结果压入栈顶
0x74 ineg 将栈顶两 int 型数值取负并将结果压入栈顶
0x75 lneg 将栈顶两 long 型数值取负并将结果压入栈顶
0x76 fneg 将栈顶两 float 型数值取负并将结果压入栈顶
0x77 dneg 将栈顶两 double 型数值取负并将结果压入栈顶
0x78 ishl 将 int 型数值左移指定位数并将结果压入栈顶
0x79 lshl 将 long 型数值左移指定位数并将结果压入栈顶
0x7a ishr 将 int 型数值右(带符号)移指定位数并将结果压入栈顶
0x7b lshr 将 long 型数值右(带符号)移指定位数并将结果压入栈顶
0x7c iushr 将 int 型数值右(无符号)移指定位数并将结果压入栈顶
0x7d lushr 将 long 型数值右(无符号)移指定位数并将结果压入栈顶
0x7e iand 将栈顶两 int 型数值作“按位与”并将结果压入栈顶
0x7f land 将栈顶两 long 型数值作“按位与”并将结果压入栈顶
0x80 ior 将栈顶两 int 型数值作“按位或”并将结果压入栈顶
0x81 lor 将栈顶两 long 型数值作“按位或”并将结果压入栈顶
0x82 ixor 将栈顶两 int 型数值作“按位异或”并将结果压入栈顶
0x83 lxor 将栈顶两 long 型数值作“按位异或”并将结果压入栈顶
0x84 iincMN (M 为非负整数,N 为整数)将局部变量数组的第 M 个单元中 的 int 值增加 N,常用于 for 循环中自增量的更新
0x85 i2l 将栈顶 int 型数值强制转换成 long 型数值,并将结果压入栈 顶
0x86 i2f 将栈顶 int 型数值强制转换成 float 型数值,并将结果压入 栈顶
0x87 i2d 将栈顶 int 型数值强制转换成 double 型数值,并将结果压入 栈顶
0x88 l2i 将栈顶 long 型数值强制转换成 int 型数值,并将结果压入栈 顶
0x89 l2f 将栈顶 long 型数值强制转换成 float 型数值,并将结果压入 栈顶
字节 码 助记符 指令含义
0x8a l2d 将栈顶 long 型数值强制转换成 double 型数值,并将结果压 入栈顶
0x8b f2i 将栈顶 float 型数值强制转换成 int 型数值,并将结果压入 栈顶
0x8c f2l 将栈顶 float 型数值强制转换成 long 型数值,并将结果压入 栈顶
0x8d f2d 将栈顶 float 型数值强制转换成 double 型数值,并将结果压 入栈顶
0x8e d2i 将栈顶 double 型数值强制转换成 int 型数值,并将结果压入 栈顶
0x8f d2l 将栈顶 double 型数值强制转换成 long 型数值,并将结果压 入栈顶
0x90 d2f 将栈顶 double 型数值强制转换成 float 型数值,并将结果压 入栈顶
0x91 i2b 将栈顶 int 型数值强制转换成 byte 型数值,并将结果压入栈 顶
0x92 i2c 将栈顶 int 型数值强制转换成 char 型数值,并将结果压入栈 顶
0x93 i2s 将栈顶 int 型数值强制转换成 short 型数值,并将结果压入 栈顶
0x94 lcmp 比较栈顶两 long 型数值的大小,并将结果(1、0 或 -1)压 入栈顶
0x95 fcmpl 比较栈顶两 float 型数值的大小,并将结果(1、0 或 -1)压入栈顶 ;当其中一个数值为 “NaN” 时,将-1压入栈顶
0x96 fcmpg 比较栈顶两 float 型数值的大小,并将结果(1、0 或 -1)压入栈顶 ;当其中一个数值为 “NaN” 时,将1压入栈顶
0x97 dcmpl 比较栈顶两 double 型数值的大小,并将结果(1、0 或 -1)压入栈顶 ;当其中一个数值为 “NaN” 时,将-1压入栈顶
0x98 dcmpg 比较栈顶两 double 型数值的大小,并将结果()1、0 或 -1压入栈顶 ;当其中一个数值为 “NaN” 时,将1压入栈顶
0x99 ifeq 当栈顶 int 型数值等于 0 时跳转
0x9a ifne 当栈顶 int 型数值不等于 0 时跳转
0x9b iflt 当栈顶 int 型数值小于 0 时跳转
0x9c ifge 当栈顶 int 型数值大于或等于 0 时跳转
0x9d ifgt 当栈顶 int 型数值大于 0 时跳转
字节 码 助记符 指令含义
0x9e ifle 当栈顶 int 型数值小于或等于 0 时跳转
0x9f if_icmpeq 比较栈顶两 int 型数值的大小,当结果等于 0 时跳转
0xa0 if_icmpne 比较栈顶两 int 型数值的大小,当结果不等于 0 时跳转
0xa1 if_icmplt 比较栈顶两 int 型数值的大小,当结果小于 0 时跳转
0xa2 if_icmpge 比较栈顶两 int 型数值的大小,当结果大于或等于 0 时跳转
0xa3 if_icmpgt 比较栈顶两 int 型数值的大小,当结果大于 0 时跳转
0xa4 if_icmple 比较栈顶两 int 型数值的大小,当结果小于或等于 0 时跳转
0xa5 if_acmpeq 比较栈顶两 引用 型数值,当结果相等时跳转
0xa6 if_acmpne 比较栈顶两 引用 型数值,当结果不相等时跳转
0xa7 goto 无条件跳转
0xa8 jsr 跳转至指定的 16 位 offset 位置,并将 jsr 的下一条指令地 址压入栈顶
0xa9 ret 返回至局部变量指定的 index 的指令位置(一般与 jsr 或 jsr_w 联合使用)
0xaa tableswitch 用于 switch 条件跳转,case 值连续(可变长度指令)
0xab lookupswitch 用于 switch 条件跳转,case 值不连续(可变长度指令)
0xac ireturn 从当前方法返回 int
0xad lreturn 从当前方法返回 long
0xae freturn 从当前方法返回 float
0xaf dreturn 从当前方法返回 double
0xb0 areturn 从当前方法返回对象引用
0xb1 return 从当前方法返回 void
0xb2 getstatic 获取指定类的静态字段,并将其压入栈顶
0xb3 putstatic 为指定类的静态字段赋值
0xb4 getfield 获取指定类的实例字段,并将其压入栈顶
0xb5 putfield 为指定类的实例字段赋值
0xb6 invokevirtual 调用实例方法
0xb7 invokespecial 调用超类构造方法,实例初始化方法,私有方法
0xb8 invokestatic 调用静态方法
0xb9 invokeinterface 调用接口方法
字节 码 助记符 指令含义
0xba -- 无此指令
0xbb new 创建一个对象,并将其引用值压入栈顶
0xbc newarray 创建一个指定的原始类型(如 int、float、char 等)的数 组,并将其引用值压入栈顶
0xbd anewarray 创建一个引用型(如类、接口、数组 等)的数组,并将其引用 值压入栈顶
0xbe arraylength 获得数组的长度值并将其压入栈顶
0xbf athrow 将栈顶的异常抛出
0xc0 checkcast 校验类型转换,校验未通过将抛出 ClassCastException
0xc1 instanceof 校验对象是否是指定的类的实例,如果是则将 1 压入栈顶,否 则将 0 压入栈顶
0xc2 monitorenter 获得对象的锁,用于同步方法或同步块
0xc3 monitorexit 释放对象的锁,用于同步方法或同步块
0xc4 wide 扩展局部变量的宽度
0xc5 multianewarray 创建指定类型和指定维度的多维数组(执行该指定时,操作数栈 中必须包含各维度的长度),并将其引用值压入栈顶
0xc6 ifnull 为 null 时跳转
0xc7 ifnonnull 不为 null 时跳转
0xc8 goto_w 无条件跳转(宽索引)
0xc9 jsr_w 跳转至指定的 32 位 offset 位置,并将 jsr_w 的下一条指令 地址压入栈顶

基本数据类型

  • 除了long和double类型外,每个变量都占局部变量区中的一个变量槽(slot),而long及double会占用两个连续的变量槽

  • 大多数对于boolean、byte、short和char类型数据的操作,都使用相应的int类型作为运算类型

一、加载和储存指令

  • 存储数据的操作数栈和局部变量表主要就是由加载和存储指令进行操作

  • 除此之外,还有少量指令,如访问对象的字段或数组元素的指令也会向操作数栈传输数据

将一个局部变量加载到操作栈

  • iload、iload<n>、lload、lload<n>、fload、fload<n>、dload、dload<n>、aload、aload_<n>

将一个数值从操作数栈存储到局部变量表

  • istore、istore<n>、lstore、lstore<n>、fstore、fstore<n>、dstore、dstore<n>、astore、astore_<n>

将一个常量加载到操作数栈

  • bipush、sipush、ldc、ldc_w、ldc2_w、aconst_null、iconst_m1、iconst<i>、lconst<l>、fconst<f>、dconst<d>

扩充局部变量表的访问索引的指令

  • wide<n>:0、1、2、_3

二、const系列

该系列命令主要负责把简单的数值类型送到栈顶,该系列命令不带参数 注意只把简单的数值类型送到栈顶时,才使用如下的命令

比如对应int型,该方式只能把-1,0,1,2,3,4,5(分别采用iconst_m1,iconst_0,iconst_1, iconst_2, iconst_3, iconst_4, iconst_5)送到栈顶

对于int型,其他的数值请使用push系列命令(比如bipush)

三、push系列

该系列命令负责把一个整形数字(长度比较小)送到到栈顶。该系列命令有一个参数,用于指定要送到栈顶的数字 注意该系列命令只能操作一定范围内的整形数值,超出该范围的使用将使用ldc命令系列 .

四、ldc系列

该系列命令负责把数值常量或String常量值从常量池中推送至栈顶。该命令后面需要给一个表示常量在常量池中位置(编号)的参数

哪些常量是放在常量池呢?比如

final static int id=32768;
final static float double=6.5

对于const系列命令和push系列命令操作范围之外的数值类型常量,都放在常量池中 另外,所有不是通过new创建的String都是放在常量池中的

五、load系列

第一种:该系列命令负责把本地变量的送到栈顶。这里的本地变量不仅可以是数值类型,还可以是引用类型

  • 对于前四个本地变量可以采用iload_0,iload_1,iload_2,iload_3(它们分别表示第0,1,2,3个整形变量)这种不带参数的简化命令形式

  • 对于第4以上的本地变量将使用iload命令这种形式,在它后面给一参数,以表示是对第几个(从0开始)本类型的本地变量进行操作。对本地变量所进行的编号,是对所有类型的本地变量进行的(并不按照类型分类)

  • 对于非静态函数,第一变量是this,即其对应的操作是aload_0

  • 还有函数传入参数也算本地变量,在进行编号时,它是先于函数体的本地变量的

第二种:该系列命令负责把数组的某项送到栈顶。该命令根据栈里内容来确定对哪个数组的哪项进行操作

  • 比如,如果有成员变量

final String names[] = {"robin","hb"};
  • 那么这句话:

String str = names[0];
  • 对应的指令为

六、store系列

第一种:该系列命令负责把栈顶的值存入本地变量。这里的本地变量不仅可以是数值类型,还可以是引用类型

如果是把栈顶的值存入到前四个本地变量的话,采用的是istore_0,istore_1,istore_2,istore_3(它们分别表示第0,1,2,3个本地整形变量)这种不带参数的简化命令形式

如果是把栈顶的值存入到第四个以上本地变量的话,将使用istore命令这种形式,在它后面给一参数,以表示是把栈顶的值存入到第几个(从0开始)本地变量中。对本地变量所进行的编号,是对所有类型的本地变量进行的(并不按照类型分类

对于非静态函数,第一变量是this,它是只读的

还有函数传入参数也算本地变量,在进行编号时,它是先于函数体的本地变量的

第二种:该系列命令负责把栈顶项的值存到数组里。该命令根据栈里内容来确定对哪个数组的哪项进行操作

  • 比如,如下代码:

int moneys[]=new int[5];
moneys[1]=100;
  • 其对应的指令为:

七、pop系列

该系列命令似乎只是简单对栈顶进行操作

八、栈顶元素数学操作及移位操作系列

该系列命令用于对栈顶元素行数学操作,和对数值进行移位操作。移位操作的操作数和要移位的数都是从栈里取得

  • 比如对于代码:

int k=100;k=k>>1;
  • 其对应的JVM指令为:

运算指令

  • 运算或算术指令用于对两个操作数栈上的值进行某种特定运算,并把结果重新存入到操作栈顶

  • 算术指令分为两种:整型运算的指令和浮点型运算的指令

  • 无论是哪种算术指令,都使用Java虚拟机的数据类型,由于没有直接支持byte、short、char和boolean类型的算术指令,使用操作int类型的指令代替

类型转换指令

  • 类型转换指令可以将两种不同的数值类型进行相互转换

  • 这些转换操作一般用于实现用户代码中的显式类型转换操作,或者用来处理字节码指令集中数据类型相关指令无法与数据类型一一对应的问题

  • 宽化类型转换

    • int类型到long、float或者double类型

    • long类型到float、double类型

    • float类型到double类型

    • i2l、f2b、l2f、l2d、f2d

  • 窄化类型转换

    • i2b、i2c、i2s、l2i、f2i、f2l、d2i、d2l和d2f

对象创建与访问指令

  • 创建类实例的指令:new

  • 创建数组的指令:newarray、anewarray、multianewarray

  • 访问类字段(static字段,或者称为类变量)和实例字段(非static字段,或者称为实例变量)的指令:getfield、putfield、getstatic、putstatic

  • 把一个数组元素加载到操作数栈的指令:baload、caload、saload、iaload、laload、faload、daload、aaload

  • 将一个操作数栈的值存储到数组元素中的指令:bastore、castore、sastore、iastore、fastore、dastore、aastore

  • 取数组长度的指令:arraylength

  • 检查类实例类型的指令:instanceof、checkcast

操作数栈管理指令

  • 直接操作操作数栈的指令:

  • 将操作数栈的栈顶一个或两个元素出栈:pop、pop2。

  • 复制栈顶一个或两个数值并将复制值或双份的复制值重新压入栈顶:dup、dup2、dup_x1、dup2_x1、dup_x2、dup2_x2。

  • 将栈最顶端的两个数值互换:swap

控制转移指令

  • 控制转移指令可以让Java虚拟机有条件或无条件地从指定的位置指令而不是控制转移指令的下一条指令继续执行程序。

  • 从概念模型上理解,可以认为控制转移指令就是在有条件或无条件地修改PC寄存器的值。

  • 条件分支:ifeq、iflt、ifle、ifne、ifgt、ifge、ifnull、ifnonnull、if_icmpeq、if_icmpne、if_icmplt、if_icmpgt、if_icmple、if_icmpge、if_acmpeq和if_acmpne。

  • 复合条件分支:tableswitch、lookupswitch。

  • 无条件分支:goto、goto_w、jsr、jsr_w、ret。

  • 在Java虚拟机中有专门的指令集用来处理int和reference类型的条件分支比较操作,为了可以无须明显标识一个实体值是否null,也有专门的指令用来检测null值

方法执行

以下面代码为例看一下执行引擎是如何将一段代码在执行部件上执行的

public class Math{
    public static void main(String[] args){
        int a = 1 ;
        int b = 2;
        int c = (a+b)*10;
    }
}
  • 其中main的字节码指令如下

对应到执行引擎的各执行部件如图:

在开始执行方法之前,PC寄存器存储的指针是第1条指令的地址,局部变量区和操作栈都没有数据。从第1条到第4条指令分别将a、b两个本地变量赋值,对应到局部变量区就是1和2分别存储常数1和2,如下图:

第5条和第6条指令分别是将两个局部变量入栈,然后相加,如图:

1先入栈2后入栈,栈顶元素是2,第7条指令是将栈顶的两个元素弹出后相加,结果再入栈,如图:

可以看出,变量a和b相加的结果3存在当前栈顶中,接下来第8条指令将10入栈,如图:

当前PC寄存器执行的地址是9,下一个操作是将当前栈的两个操作数弹出进行相乘并把结果压入栈中,如图:

第10条指令是将当前的栈顶元素存入局部变量3中,如图:

第10条指令执行完后栈中元素出栈,出栈的元素存储在局部变量区3中,对应的是变量c的值。最后一条指令是return,这条指令执行完后当前的这个方法对应的这些部件会被JVM回收,局部变量区的所有值将全部释放,PC寄存器会被销毁,在Java栈中与这个方法对应的栈帧将消失

方法调用

常见方法类型

方法调用指令

我们再从JVM层面分析下,JVM里面是通过哪里指令来实现方法的调用的:

具体来说,Java字节码指令中与调用相关的指令共有五种

  1. invokevirtual

    • 用于调用对象的实例方法,根据对象的实际类型进行分派(虚方法分派),这也是Java语言中最常见的方法分派方式

  2. invokeinterface

    • 用于调用接口方法,它会在运行时搜索一个实现了这个接口方法的对象,找出适合的方法进行调用

  3. invokespecial

    • 用于调用一些需要特殊处理的实例方法,包括实例初始化(<init>)方法、私有方法和父类方法

  4. invokestatic

    • 调用静态方法(static方法)

  5. invokedynamic

    • 用于在运行时动态解析出调用点限定符所引用的方法,并执行该方法,前面4条调用指令的分派逻辑都固化在Java虚拟机内部,而invokedynamic指令的分派逻辑是由用户所设定的引导方法决定的

静态绑定机制

静态绑定:在编译的时候,就确定这个方法和这个类是绑定的。也就是main方法中调用f1方法的时候,在编译器就已经知道f1方法是属于Target这个类(要注意重载和重写)

哪些方法会在编译时就确定对应的类呢?

  • invokestatic:static

  • invokespecial:私有、final、构造方法、super

package com.example.demo.service;
public class Test {
    public static void main(String[] args) {
        Target.f1(); // 调用静态方法
    }
}
​
class Target {
    public static void f1() {
        System.out.println("Target — f1()");
    }
}

编译后执行:javap -v Test.class

上面的源代码中执行方法调用的语句(Target.f1())被编译器编译成了一条指令 :invokestatic #2 接下来我们看看JVM是如何处理这条指令的 :

  • 其实在上图中按照Start!开始按图索骥已经能够摸索到大致流程,但有点潦草

  1. 指令中的#2指的是Test类的常量池中第2个常量表的索引项

    • 这个常量表(CONSTATN_Methodref_info) 记录的是方法f1信息的符号引用

    • 包括f1所在的类名,方法名和返回类型)

    • JVM会首先根据这个符号引用找到方法f1所在的类的全限定名

  2. 紧接着JVM会加载、链接和初始化Target类

  3. 然后在Father类所在的方法区中找到f1()方法的直接地址,并将这个直接地址记录到Test类的常量池索引为2的常量表中。这个过程叫常量池解析,以后再次调用Target.f1()时,将直接找到f1方法的字节码

  4. 完成了Test类常量池索引项2的常量表的解析之后,JVM就可以调用f1()方法,并开始解释执行f1()方法中的指令了

通过上面的过程,我们发现经过常量池解析之后,JVM就能够确定要调用的f1()方法具体在内存的什么位置上了。实际上,这个信息在编译阶段就已经在Test类的常量池中记录了下来。这种在编译阶段就能够确定调用哪个方法的方式,我们叫做静态绑定机制

注意 :

  • 被static、private、final修饰的方法都会被编译成invokestatic指令

  • 另外所有类的初始化方法会被编译成invokespecial指令。JVM会采用静态绑定机制来顺利的调用这些方法

动态绑定机制

package com.example.demo.service;
public class Test {
    public static void main(String[] args) {
        Father father = new Son();
        father.f1(); //Son-f1()
    }
}
​
// 被调用的父类
class Father {
    public void f1() { System.out.println("father-f1()");}
    public void f1(int i) { System.out.println("father-f1() para-int " + i); }
}
// 被调用的子类
class Son extends Father {
    public void f1() { System.out.println("Son-f1()");}
    public void f1(char c) { System.out.println("Son-s1() para-char " + c);}
}

编译后执行:javap -v Test.class

  • 上面的源代码中有三个重要的概念:多态(polymorphism) 、方法覆盖 、方法重载

  • 打印的结果经过上面静态绑定的分析,我相信大家也都比较清楚了

  • 但是JVM是如何知道father.f1()调用的是子类Son中方法而不是Father中的方法呢?

  • 在解释这个问题之前,我们首先简单的讲下JVM管理的一个非常重要的数据结构——方法表

方法表有两个特点

  • 子类方法表中继承了父类的方法

    • 比如Father extends Object

  • 相同的方法(相同的方法签名:方法名和参数列表)在所有类的方法表中的索引相同

对于上面的源代码,编译器首先会把main方法编译成下面的字节码指令:

其中invokevirtual指令的详细调用过程是这样的:

  1. invokevirtual指令中的#14指的是Test类的常量池中第4个常量表的索引项。这个常量表(CONSTATN_Methodref_info) 记录的是方法f1信息的符号引用(包括f1所在的类名,方法名和返回类型)。JVM会首先根据这个符号引用找到调用方法f1的类的全限定名: com/example/demo/service/Father。这是因为调用方法f1的类的对象father声明为Father类型

  2. 在Father类型的方法表中查找方法f1,如果找到,则将方法f1在方法表中记录到Test类的常量池中(常量池解析 )。这里有一点要注意:如果Father类型方法表中没有方法f1,那么即使Son类型中方法表有,编译的时候也通过不了。因为调用方法f1的类的对象father的声明为Father类型

  3. 在调用invokevirtual指令前有一个aload_1指令,它会将开始创建在堆中的Son对象的引用压入操作数栈。然后invokevirtual指令会根据这个Son对象的引用首先找到堆中的Son对象,然后进一步找到Son对象所属类型的方法表

  4. 这时通过第(2)步中解析完成的将方法f1在方法表中记录到Test类的常量池,可以定位到Son类型方法表中的方法f1(),然后通过直接地址找到该方法字节码所在的内存空间

根据对象(father)的声明类型(Father)还不能够确定调用方法f1的位置,必须根据father在堆中实际创建的对象类型Son来确定f1方法所在的位置。这种在程序运行过程中,通过动态创建的对象的方法表来定位方法的方式,我们叫做 动态绑定机制

拓展

上面的过程反映出在方法覆盖的多态调用的情况下,JVM是如何定位到准确的方法的 但是下面的调用方法JVM是如何定位的呢?(仍然使用上面代码中的Father和Son类型)

package com.example.demo.service;
public class Test {
    public static void main(String[] args) {
        Father father = new Son();
//        father.f1();//Son-f1()
        char c = 'a';
        father.f1(c); //father-f1() para-int 97
    }
}
​
// 被调用的父类
class Father {
    public void f1() { System.out.println("father-f1()");}
    public void f1(int i) { System.out.println("father-f1() para-int " + i); }
}
// 被调用的子类
class Son extends Father {
    public void f1() { System.out.println("Son-f1()");}
    public void f1(char c) { System.out.println("Son-s1() para-char " + c);}
}
  • 问题是Fahter类型中并没有方法签名为f1(char)的方法呀 !!!

  • 但打印结果显示JVM调用了Father类型中的f1(int)方法,并没有调用到Son类型中的f1(char)方法

    • JVM首先是根据对象father声明的类型Father来解析常量池的(也就是用Father方法表中的索引项来代替常量池中的符号引用)

    • 如果Father中没有匹配到”合适” 的方法,就无法进行常量池解析,这在编译阶段就通过不了

    • 那么什么叫”合适”的方法呢?当然,方法签名完全一样的方法自然是合适的

    • 上面的代码中调用father.f1(char),Father类型并没有f1(char)的方法签名

    • 实际上,JVM会找到一种“凑合”的办法,就是通过 参数的自动转型 来找到“合适”的 方法

    • 比如char可以通过自动转型成int,那么Father类中就可以匹配到这个方法了

如果通过自动转型发现可以“凑合”出两个方法的话怎么办?比如下面的代码 :

class Father{
    public void f1(Object o){ System.out.println("Object");} 
    public void f1(double[] d){ System.out.println("double[]");}
} 
public class Demo{
    public static void main(String[] args) {
        new Father().f1(null); //打印结果: double[]
    }
}
  • null可以引用于任何的引用类型,那么JVM如何确定“合适”的方法呢。一个很重要的标准就是

    • 如果一个方法可以接受传递给另一个方法的任何参数,那么第一个方法就相对不合适。比如上面的代码: 任何传递给f1(double[])方法的参数都可以传递给f1(Object)方法,而反之却不行,那么f1(double[])方法就更合适。因此JVM就会调用这个更合适的方法

总结

  • 所有私有方法、静态方法、构造器及初始化方法都是采用静态绑定机制。在编译器阶段就已经指明了调用方法在常量池中的符号引用,JVM运行的时候只需要进行一次常量池解析即可

  • 类对象方法的调用必须在运行过程中采用动态绑定机制

    • 首先,根据对象的声明类型(对象引用的类型)找到“合适”的方法。具体步骤如下:

      • 如果能在声明类型中匹配到方法签名完全一样(参数类型一致)的方法,那么这个方法是最合适的

      • 在上一条不能满足的情况下,寻找可以“凑合”的方法。标准就是通过将参数类型进行自动转型之后再进行匹配。如果匹配到多个自动转型后的方法签名f(A)和f(B),则用下面的标准来确定合适的方法:传递给f(A)方法的参数都可以传递给f(B),则f(A)最合适。反之f(B)最合适

      • 如果仍然在声明类型中找不到“合适”的方法,则编译阶段就无法通过。然后,根据在堆中创建对象的实际类型找到对应的方法表,从中确定具体的方法在内存中的位置

.

posted @ 2019-06-29 18:43  鞋破露脚尖儿  阅读(999)  评论(0编辑  收藏  举报