jvm虚拟机笔记<四> 虚拟机字节码执行引擎
一、运行时栈帧结构
栈帧是用于支持虚拟机进行方法调用和执行的数据结构,是虚拟机栈的栈元素。
栈帧存储了局部变量表,操作数栈,动态连接,和返回地址等。
每一个方法的执行 对应的一个栈帧在虚拟机里面从入栈到出栈的过程。
只有位于栈顶的栈帧才有有效的,对应的方法称为当前方法。
执行引擎运行的所有指令只针对当前栈帧和当前方法。
1.局部变量表
局部变量表存放的一组变量的存储空间。存放方法参数和方法内部定义的局部变量表。
在java编译成class的时候,已经确定了局部变量表所需分配的最大容量。
局部变量表的最小单位是一个Slot。
虚拟机规范没有明确规定一个Slot占多少大小。只是规定,它可以放下boolean,byte,...reference &return address.
reference 是指一个对象实例的引用。关于reference的大小,目前没有明确的指定大小。但是我们可以理解为它就是类似C++中的指针。
局部变量表的读取方式是索引,从0开始。所以局部变量表可以简单理解为就是一个表.
局部变量表的分配顺序如下:
- this 引用。可以认为是隐式参数。
- 方法的参数表。
根据局部变量顺序,分配Solt。
一个变量一个solt,64为的占2个solt。java中明确64位的是long & double
为了尽可能的节约局部变量表,Solt可以重用。
注意:局部变量只给予分配的内存,没有class对象的准备阶段,所以局部变量在使用前,必须先赋值。
2.操作数栈
操作数栈在概念上很像寄存器。
java虚拟机无法使用寄存器,所以就有操作数栈来存放数据。
虚拟机把操作数栈作为它的工作区——大多数指令都要从这里弹出数据,执行运算,然后把结果压回操作数栈。
比如,iadd指令就要从操作数栈中弹出两个整数,执行加法运算,其结果又压回到操作数栈中,看看下面的示例,
它演示了虚拟机是如何把两个int类型的局部变量相加,再把结果保存到第三个局部变量的:
begin
iload_0 // push the int in local variable 0 onto the stack
iload_1 // push the int in local variable 1 onto the stack
iadd // pop two ints, add them, push result
istore_2 // pop int, store into local variable 2
end
操作数栈 的数据读取、写入就是出栈和如栈操作。
3.动态连接
每个栈帧都包含一个指向运行时常量池的引用,持有这个引用是为了支持动态连接。
符号池的引用,有一部分是在第一次使用或者初始化的时候就确定下来,这个称为静态引用。
还有一部分是在每次执行的时候采取确定,这个就是动态连接。
4.方法返回地址
方法只有2中退出方式,正常情况下,遇到return指令退出。还有就是异常退出。
正常情况:一般情况下,栈帧会保存 在程序计数器中的调用者的地址。虚拟机通过这个方式,执行方法调用者的地址,
然后把返回值压入调用者中的操作数栈。
异常情况:方法不会返回任何值,返回地址有异常表来确定,栈帧一般不存储信息。
二、方法调用
方法调用阶段不是执行该方法,而仅仅时确认要调用那个方法。class文件在编译阶段没有连接这一过程,、
所以动态连接这个在C++就已经有的技术,在java运用到了一个新的高度。所有的函数(除了私有方法,构造方法 & 静态方法,下同),理论上
都可以时C++里面的虚函数。所以所有的函数都需要通过动态绑定来确定“明确”的函数实体。
解析
所有方法调用的目标方法都是常量池中的符号引用。在类的加载解析阶段,会将一部分目标方法转化为直接引用。(可以理解为具体方法的直接地址)
可以转化的方法,主要为静态方法 & 私有方法(编译期可知,运行期不可变)。
Java虚拟机提供5中方法调用命令:
invokestatic:调用静态方法
invokespecial:调用实例构造器,私有方法和父类方法
invokevirtual:调用虚方法
invokeinterface:调用接口方法
invokedynamic:现在运行时动态解析出该方法,然后执行。
invokestatic & invokespecial 对应的方法,都是在加载解析后,可以直接确定的。
所以这些方法为非虚方法。
java规定 final修饰的是一种非虚方法。
分派
1.静态分派
所有依赖静态类型来定位方法执行版本的分派动作称为静态分派,其典型应用是方法重载。
静态分派实际上发生在方法编译阶段,故此动作实际上不是虚拟机执行的。
Human man = new Man();
这里的Human我们理解为静态类型,后面的Man是实际类型。我们在编译器只知道静态类型,后面的实际类型等到动态连接的时候才知道。
虚拟机在重载时,是通过参数的静态类型,而不是实际类型来判断使用那个方法的。
2.动态分派
在运行期间根据实际类型确定方法执行版本的分派过程称为动态分派。,典型应用是方法重写
先从当前类里面寻找“同名”的该方法,如果没有,就从下往上从其各个父类里面找,知道找到为止!
这个找到的方法,就是我们实际要调的方法。如果找不到,就是exception。一般情况下,编译工具会帮我们避免这种情况。
3.单分派与多分派
方法接收者与方法的参数统称为方法的宗量(方法的版本与方法参数)
静态分派过程中需要确定静态类型与方法参数的类型,所以静态分派过程为多分派。
方法的选择是在静态编译的时候就确认的(通过静态类型),只是需要进一步确认实体类型。所以动态分派是单分派。
动态类型语言支持:
使用C++语言可以定义一个调用方法:
void sort(int list[],const int size,int (*compare)(int,int));
但是java很难做到这一点,
void sort(List list,Compare c);Compare 一般要用接口实现。
在java 1.7 有一种方法可以支持该功能 MethodHandle,在虚拟机层面实现动态类型支持,方便运行其他语言。一个小应用就是可以调用到祖类方法。
总体来说,静态类型更严谨,动态类型更灵活。
三、
Java编译器输出的指令流,基本上是一种基于栈的指令集架构(Instruction Set Architecture,ISA),指令流中的指令大部分都是零地址指令,它们依赖操作数栈进行工作。
与之相对的另外一套常用的指令集架构是基于寄存器的指令集。
基于栈的指令集主要的优点就是
可移植,寄存器由硬件直接提供,程序直接依赖这些硬件寄存器则不可避免地要受到硬件的约束。
栈架构的指令集还有一些其他的优点,如代码相对更加紧凑(字节码中每个字节就对应一条指令,而多地址指令集中还需要存放参数)
编译器实现更加简单(不需要考虑空间分配的问题,所需空间都在栈上操作)等。
栈架构指令集的主要缺点是
执行速度相对来说会稍慢一些,出栈、入栈操作产生了相当多的指令数量,
频繁的内存访问。