HotPot源码结构及堆、栈等内存区的数据结构是怎么定义(转)
原文出处:http://hllvm.group.iteye.com/group/topic/26998
如果你下的只是HotSpot VM的代码的话那好办,Oracle JDK 6/Oracle JDK 7/OpenJDK 6/OpenJDK 7里的HotSpot VM基本上目录结构都是一样的。
├─agent Serviceability Agent的客户端实现 ├─make 用来build出HotSpot的各种配置文件 ├─src HotSpot VM的源代码 │ ├─cpu CPU相关代码(汇编器、模板解释器、ad文件、部分runtime函数在这里实现) │ ├─os 操作系相关代码 │ ├─os_cpu 操作系统+CPU的组合相关的代码 │ └─share 平台无关的共通代码 │ ├─tools 工具 │ │ ├─hsdis 反汇编插件 │ │ ├─IdealGraphVisualizer 将server编译器的中间代码可视化的工具 │ │ ├─launcher 启动程序“java” │ │ ├─LogCompilation 将-XX:+LogCompilation输出的日志(hotspot.log)整理成更容易阅读的格式的工具 │ │ └─ProjectCreator 生成Visual Studio的project文件的工具 │ └─vm HotSpot VM的核心代码 │ ├─adlc 平台描述文件(上面的cpu或os_cpu里的*.ad文件)的编译器 │ ├─asm 汇编器接口 │ ├─c1 client编译器(又称“C1”) │ ├─ci 动态编译器的公共服务/从动态编译器到VM的接口 │ ├─classfile 类文件的处理(包括类加载和系统符号表等) │ ├─code 动态生成的代码的管理 │ ├─compiler 从VM调用动态编译器的接口 │ ├─gc_implementation GC的实现 │ │ ├─concurrentMarkSweep Concurrent Mark Sweep GC的实现 │ │ ├─g1 Garbage-First GC的实现(不使用老的分代式GC框架) │ │ ├─parallelScavenge ParallelScavenge GC的实现(server VM默认,不使用老的分代式GC框架) │ │ ├─parNew ParNew GC的实现 │ │ └─shared GC的共通实现 │ ├─gc_interface GC的接口 │ ├─interpreter 解释器,包括“模板解释器”(官方版在用)和“C++解释器”(官方版不在用) │ ├─libadt 一些抽象数据结构 │ ├─memory 内存管理相关(老的分代式GC框架也在这里) │ ├─oops HotSpot VM的对象系统的实现 │ ├─opto server编译器(又称“C2”或“Opto”) │ ├─prims HotSpot VM的对外接口,包括部分标准库的native部分和JVMTI实现 │ ├─runtime 运行时支持库(包括线程管理、编译器调度、锁、反射等) │ ├─services 主要是用来支持JMX之类的管理功能的接口 │ ├─shark 基于LLVM的JIT编译器(官方版里没有使用) │ └─utilities 一些基本的工具类 └─test 单元测试
你看到的目录结构应该是类似这样的
=========================
GC堆:
其实这个还好。在VM初始化的时候通过mmap()/VirtualAlloc()来申请(reserve)了一块地址空间作为GC堆之后,用几个指针记住这块空间的首末地址和中间的区域划分。
最顶层的结构在CollectedHeap的实现类里(GenCollectedHeap、ParallelScavengeHeap、G1CollectedHeap)。
这些的里面再进一步划分出区域,每个区域记着自己的首末地址和分配指针的位置。例如GenCollectedHeap经过初始化之后里面
_gens数组里会存着若干Generation,其中可能是DefNewGeneration、TenuredGeneration或者
ParNewGeneration、ConcurrentMarkSweepGeneration之类,再里面又有eden_space、
from_space、to_space之类的里面装着具体空间的指针。
=========================
栈:
在正常运行的时候其实HotSpot
VM根本就没有显式的数据结构用来管理栈。最多也就是Thread类的实例里有记住栈底地址(stack_base)和栈的最大大小
(stack_size)。栈顶指针是直接用硬件寄存器的(例如x86-64上的rsp),所以也不需要显式的数据结构。
所谓“分配栈帧”就是把栈顶指针寄存器减去(或加上)一个大小,所谓“释放栈帧”就是把那个寄存器加上(或减去)一个大小。
但栈帧总得有结构吧?有是有,不过是隐式的,没有直接对应的C++类。在平台相关的frame_<arch>.hpp里有部分结构的描述。
OpenJDK官方wiki上有篇资料简单讲了HotSpot VM的解释器栈帧的结构,但要记住那只是HotSpot VM的栈的栈帧的其中一种可能:https://wiki.openjdk.java.net/display/HotSpot/JavaControlStack