JVM理论:(三/2)字节码指令
回顾一下前文,知道了属性表的Code属性存着Java程序方法体的代码经过Javac编译器处理后,最终变为字节码指令。还知道了Code属性表中的code是一个u1类型的单字节,取值范围是0x00~0xFF,也就是一共最多能表达256条指令。
由于Java虚拟机采用面向操作数栈而并非寄存器的架构,所以大多数的指令都不包含操作数(跟随操作码后所需的参数),只有一个操作码(代表指令的代码)。
在Java虚拟机指令集中,大多数的指令都包含了其操作所对应的数据类型信息,i代表对int类型的数据操作、l代表 long、s代表short、b代表 byte、 c代表char、 f代表float、d代表double、a代表reference。但由于Java虚拟机的操作码长度只有一个字节,所以不可能让每个指令支持每种数据类型,因此必要时会对数据类型进行转换,大多数指令没有支持整数类型 byte、char、short或boolean类型,实际上会转换为使用对应的int类型作为运算类型。
字节码操作按用途大致可以分为9类。
1、加载和存储指令
加载和存储指令用于将数据在栈帧中的局部变量表和操作数栈之间来回传输。除此之外,还有少量指令,如访问对象的字段或数组元素的指令也会向操作数栈传输数据。
- 将一个局部变量加载到操作栈:iload、iload_<n>、lload、lload_<n>、fload、fload_<n>、dload、dload_<n>、aload、aload_<n>。
- 将一个数值从操作数栈存储到局部变量表:istore、istore_<n>、lstore、lstore_<n>、fstore、fstore_<n>、dstore、dstore_<n>、astore、astore_<n>。
- 将一个常量加载到操作数栈:bipush、sipush、ldc、ldc_w、ldc2_w、aconst_null、iconst_m1、iconst_<i>、lconst_<l>、fconst_<f>、dconst_<d>。
- 扩充局部变量的访问索引的指令:wide。
2、运算指令
运算指令用于对两个操作数栈上的值进行某种特定运算,并把结果重新存入到操作栈顶。
大体上可分为对整型和浮点型两种数据进行运算,对于byte、short、char和 boolean 类型的运算,使用操作int类型的指令代替。
Java虚拟机规范规定了在处理整型数据时,只有除法指令(idiv和ldiv)以及求余指令(irem和lrem)中当出现除数为0时会导致虚拟机抛出异常ArithmeticException,其余任何整型数运算场景都不应该抛出运行时异常。
- 加法指令: iadd, ladd, fadd, dadd。
- 减法指令: isub, lsub, fsub, dsub。
- 乘法指令: imul, lmul, fmul, dmul。
- 除法指令: idiv, ldiv, fdiv, ddiv。
- 求余指令: irem, lrem, frem, drem。
- 取反指令: ineg, lneg, fneg, dneg。
- 位移指令: ishl, ishr, iushr, lshl, lshr, lushr。
- 按位或指令: ior, lor。
- 按位与指令: iand, land。
- 按位异或指令: ixor, lxor。
- 局部变量自增指令: iinc。
- 比较指令: dcmpg, dcmpl, fcmpg, fcmpl, lcmp。
3、类型转换指令
类型转换指令可以将两种不同的数值类型进行相互转换,这些转换操作一般用于实现用户代码中的显示类型转换操作,或处理字节码指令集中数据类型相关指令无法与数据类型一一对应的问题。
Java 虚拟机直接支持(转换时无需显示的转换指令)以下数值类型的宽化类型转换(小范围类型向大范围类型的安全转换):
- int 类型到 long、float 或者 double 类型。
- long 类型到 float、double 类型。
- float 类型到 double 类型。
处理窄化类型转换时,必须显式地使用转换指令来完成,这些转换指令包括:i2b、i2c、i2s、l2i、f2i、f2l、d2i、d2l 和 d2f。窄化转换过程仅仅是简单地丢弃除最低位 N 个字节意外的内容,N 是类型 T 的数据类型长度。窄化类型转换可能会导致转换结果产生不同的正负号、不同的数量级的情况,转换过程很可能会导致数值的精度丢失。Java 虚拟机规范中明确规定数值类型的窄化转换指令永远不可能导致虚拟机抛出运行时异常。
4、对象创建与访问指令
虽然类实例和数组都是对象,但 Java 虚拟机对类实例和数组的创建与操作使用了不同的字节码指令,数组和普通类的创建过程是不同的。对象创建后,就可以通过对象访问指令获取对象实例或者数组实例中的字段或者数组元素,这些指令如下。
- 创建类实例的指令:new。
- 创建数组的指令:newarray、anewarray、multianewarray。
- 访问类字段(static 字段,类变量)和实例字段(非 static 字段,实例变量)的指令:getfield、putfield、getstatic、putstatic。
- 把一个数组元素加载到操作数栈的指令:baload、caload、saload、iaload、laload、faload、daload、aaload。
- 将一个操作数栈的值存储到数组元素中的指令:bastore、castore、sastore、iastore、fastore、dastore、aastore。
- 取数组长度的指令:arraylength。
- 检查类实例类型的指令:instanceof、checkcast。
5、操作数栈管理指令
Java 虚拟机提供了一些用于直接操作操作数栈的指令,包括:
- 将操作数栈的栈顶一个或两个元素出栈:pop、pop2。
- 复制栈顶一个或两个数值并将复制值或双份的复制重新压入栈顶:dup、dup2、dup_x1、dup2_x1、dup_x2、dup2_x2。
- 将栈最顶端的两个数值互换:swap。
6、控制转移指令
控制转移指令可以让 Java 虚拟机有条件或无条件地从指定的位置指令而不是控制转移指令的下一条指令继续执行程序,从概念模型上理解,可以认为控制转移指令就是在有条件或无条件地修改 PC 寄存器的值。控制转移指令如下。
- 条件分支:ifeq、iflt、ifle、ifne、ifgt、ifge、ifnull、ifnonnull、if_icmpeq、if_icmpne、if_icmplt、if_icmpgt、if_icmple、if_icmpge、if_acmpeq 和 if_acmpne。
- 复合条件分支:tableswitch、lookupswitch。
- 无条件分支:goto、goto_w、jsr、jsr_w、ret。
各种类型的比较最终都会转化为 int 类型的比较操作,int 类型比较是否方便完善就显得尤为重要,所以 Java 虚拟机提供的 int 类型的条件分支指令是最为丰富和强大的。
7、方法调用和返回指令
- invokevirtual 指令用于调用对象的实例方法,根据对象的实际类型进行分派(虚方法分派),这也是 Java 语言中最常见的方法分派方式。
- invokeinterface 指令用于调用接口方法,它会在运行时搜索一个实现了这个接口方法的对象,找出适合的方法进行调用。
- invokespecial 指令用于调用一些需要特殊处理的实例方法,包括实例初始化方法、私有方法和父类方法。
- invokestatic 指令用于调用类方法(static 方法)。
- invokedynamic 指令用于在运行时动态解析出调用点限定符所引用的方法,并执行该方法,前面 4 条调用指令的分派逻辑都固化在 Java 虚拟机内部,而 invokedynamic 指令的分派逻辑是由用户所设定的引导方法决定的。
方法调用指令与数据类型无关,而方法返回指令是根据返回值的类型区分的,包括 ireturn(当返回值是 boolean、byte、char、short 和 int 类型时使用)、lreturn、freturn、dreturn 和 areturn,另外还有一条return 指令供声明为 void 的方法、实例初始化方法以及类和接口的类初始化方法使用。
8、异常处理指令
在 Java 程序中显式抛出异常的操作(throw 语句)都由 athrow 指令来实现,除了用 throw 语句显式抛出异常情况之外,Java 虚拟机规范还规定了许多运行时异常会在其他 Java 虚拟机指令检测到异常状况时自动抛出。例如,在前面介绍的整数运算中,当除数为零时,虚拟机会在 idiv 或 ldiv 指令中抛出 ArithmeticException 异常。
而在 Java 虚拟机中,处理异常(catch 语句)不是由字节码指令来实现的,而是采用异常表来完成的。
9、同步命令
Java 虚拟机可以支持方法级的同步和方法内部一段指令序列的同步,这两种同步结构都是使用管程(Monitor)来支持的。
(1) 方法级的同步是隐式的,即无须通过字节码指令来控制,它实现在方法调用和返回操作之中。虚拟机可以从方法常量池的方法表结构中的 ACC_SYNCHRONIZED 访问标志得知一个方法是否声明为同步方法。
当方法调用时,调用指令将会检查方法的 ACC_SYNCHRONIZED 访问标志是否被设置,如果设置了,执行线程就要求先成功持有管程,然后才能执行方法,最后当方法完成(无论是正常完成还是非正常完成)时释放管程。在方法执行期间,执行线程持有了管程,其他任何线程都无法再获取到同一个管程。如果一个同步方法执行期间抛出了异常,并且在方法内部无法处理此异常,那么这个同步方法所持有的管程将在异常抛到同步方法之外时自动释放。
(2)同步一段指令集序列通常是由 Java 语言中的 synchronized 语句块来表示的。
Java 虚拟机的指令集中有 monitorenter 和 monitorexit 两条指令来支持 synchronized 关键字的语义。编译器必须确保无论方法通过何种方式完成,方法中调用过的每条 monitorenter 指令都必须执行其对应的 monitorexit 指令,而无论这个方法是正常结束还是异常结束。
为了保证在方法异常完成时 monitorenter 和 monitorexit 指令依然可以正确配对执行,编译器会自动产生一个异常处理器,这个异常处理器声明可处理所有的异常,它的目的就是用来执行 monitorexit 指令。
以下列同步代码编译后的字节码为例:
monitorenter:获得对象的锁,用于同步方法或同步块。
monitorexit:释放对象的锁,用于同步方法或同步块。
void onlyMe(Foo f){ synchronized(f){ doSomething(); } } 编译后,这段代码生成的字节码序列如下: Method void onlyMe(Foo) 0 aload_1 //将对象f入栈 1 dup //复制栈顶元素(即f的引用) 2 astore_2 //将栈顶元素存储到局部变量表Slot 2中 3 monitorenter //以栈顶元素(即f)作为锁,开始同步 4 aload_0 //将局部变量Slot 0(即this指针)的元素入栈 5 invokevirtual#5 //调用doSomething()方法 8 aload_2 //将局部变量Slow 2的元素(即f)入栈 9 monitorexit //退出同步 10 goto 18 //方法正常结束,跳转到18返回 13 astore_3 //从这步开始是异常路径,见下面异常表的Taget 13 14 aload_2 //将局部变量Slow 2的元素(即f)入栈 15 monitorexit //退出同步 16 aload_3 //将局部变量Slow 3的元素(即异常对象)入栈 17 athrow //把异常对象重新抛出给onlyMe()方法的调用者 18 return //方法正常返回 Exception table: FromTo Target Type 4 10 13 any 13 16 13 any
https://www.cnblogs.com/wade-luffy/p/6056964.html#_label9
https://www.cnblogs.com/dennyzhangdd/p/6734638.html
https://blog.csdn.net/u013678930/article/details/51942010
https://blog.csdn.net/fouy_yun/article/details/78010952