JVM
Jvm探究
- 请你谈谈你对JVM的理解?java8虚拟机和之前的变化更新?
- 什么时OOM,什么是栈溢出StackOverFlowError? 怎么分析?
- JVM的常用调优参数有哪些?
- 内存快照如何抓取,怎么分析Dump文件?知道吗?
- 谈谈JVM中,类加载器你的认识?
1. JVM的位置
2. JVM的体系结构
3. 类加载器
作用:加载class文件
4. 双亲委派机制
双亲委派机制:安全
App加载器---Ext加载器 ---BOOT根加载器(最终执行)
1.类加载器收到类的加载的请求
2. 将这个请求向上委托给父类加载器去完成,一直向上委托,直到启动类加载器
3. 启动类加载器检查是否能够加载当前这个类,能加载就使用当前的加载器,否则 ,抛出异常,通知子类加载器进行加载
4.重复步骤3
5. 沙箱安全机制
我们都知道,程序员编写一个Java程序,默认的情况下可以访问该机器的任意资源,比如读取,删除一些文件或者网络操作等。当你把程序部署到正式的服务器上,系统管理员要为服务器的安全承担责任,那么他可能不敢确定你的程序会不会访问不该访问的资源,为了消除潜在的安全隐患,他可能有两种办法:
让你的程序在一个限定权限的帐号下运行。
利用Java的沙箱机制来限定你的程序不能为非作歹。以下用于介绍该机制。
什么是沙箱?
Java安全模型的核心就是Java沙箱(sandbox),什么是沙箱?沙箱是一个限制程序运行的环境。沙箱机制就是将 Java 代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。沙箱主要限制系统资源访问,那系统资源包括什么?——CPU、内存、文件系统、网络。不同级别的沙箱对这些资源访问的限制也可以不一样。
所有的Java程序运行都可以指定沙箱,可以定制安全策略。
java中的安全模型:
在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙箱 (Sandbox) 机制。如下图所示 JDK1.0安全模型
但如此严格的安全机制也给程序的功能扩展带来障碍,比如当用户希望远程代码访问本地系统的文件时候,就无法实现。因此在后续的 Java1.1 版本中,针对安全机制做了改进,增加了安全策略,允许用户指定代码对本地资源的访问权限。如下图所示 JDK1.1安全模型
在 Java1.2 版本中,再次改进了安全机制,增加了代码签名。不论本地代码或是远程代码,都会按照用户的安全策略设定,由类加载器加载到虚拟机中权限不同的运行空间,来实现差异化的代码执行权限控制。如下图所示 JDK1.2安全模型
当前最新的安全机制实现,则引入了域 (Domain) 的概念。虚拟机会把所有代码加载到不同的系统域和应用域,系统域部分专门负责与关键资源进行交互,而各个应用域部分则通过系统域的部分代理来对各种需要的资源进行访问。虚拟机中不同的受保护域 (Protected Domain),对应不一样的权限 (Permission)。存在于不同域中的类文件就具有了当前域的全部权限,如下图所示 最新的安全模型(jdk 1.6)
以上提到的都是基本的Java 安全模型概念,在应用开发中还有一些关于安全的复杂用法,其中最常用到的 API 就是 doPrivileged。doPrivileged 方法能够使一段受信任代码获得更大的权限,甚至比调用它的应用程序还要多,可做到临时访问更多的资源。有时候这是非常必要的,可以应付一些特殊的应用场景。例如,应用程序可能无法直接访问某些系统资源,但这样的应用程序必须得到这些资源才能够完成功能。
组成沙箱的基本组件:
字节码校验器(bytecode verifier):确保Java类文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类。
类装载器(class loader):其中类装载器在3个方面对Java沙箱起作用
它防止恶意代码去干涉善意的代码;
它守护了被信任的类库边界;
它将代码归入保护域,确定了代码可以进行哪些操作。
虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成,每一个被装载的类将有一个名字,这个命名空间是由Java虚拟机为每一个类装载器维护的,它们互相之间甚至不可见。
类装载器采用的机制是双亲委派模式。
1.从最内层JVM自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用;
2.由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内层类,破坏代码就自然无法生效。
- 存取控制器(access controller):存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定。
- 安全管理器(security manager):是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高。
- 安全软件包(security package):java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括:
- 安全提供者
- 消息摘要
- 数字签名
- 加密
- 鉴别
6. Native
- 凡是带了native关键字的,说明java的作用范围达不到了,回去调用底层c语言的库!
- 会进入本地方法栈
- 调用本地方法本地接口 JNI
- JNI作用:扩展Java的使用,融合合不同的编程语言为java所用。最初c、c++
- Java诞生的时候C、C++ 横行,想要立足,必须调用C、C++ 的程序
- 它在内存区中专门开辟了一块区域:本地方法栈(Native Method Stack),登记native方法
- 在最终执行的时候,通过JNI去加载本地方法库中的方法。
7. PC寄存器
程序计数器:Program Counter Register
每一个线程都有一个程序计数器,是线程私有的,就是一个指针,指向方法区中的方法字节码(用来存储指向一条指令的地址,
也即将要执行的指令代码),在执行引擎读取下一条指令 ,是一个非常小的内存空间,几乎可以忽略不计
8. 方法区
Method Area 方法区
方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,
简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间
静态变量、常量、类信息(构造方法、接口定义)、运行时的常量池存在方法区中,但是实例变量存在堆内存
中,和方法区无关。
static、final、Class、常量池
9. 栈
在计算机中有一句废话:程序 = 算法 + 数据
先进后出,后进先出:桶
队列:先进先出(FIFO:First Input First Output)
喝多了吐就是栈,吃多了拉就是队列。
为什么main()先执行,最后结束~
栈:栈内存,主管程序的运行,生命周期和线程同步;
线程结束,栈内存也就释放,对于栈来说,不存在垃圾回收问题
一旦线程结束,栈就Over!
栈:8大基本类型 + 对象引用 + 实例的方法
栈运行原理:栈帧
栈满了:StackOverflowError
栈 + 堆 + 方法区:交互关系
作业:画出一个对象实例化的过程,在内存中
10. 三种JVM
- Sun公司的 HotSpot(TM) 64-Bit Server VM (build 25.231-b11, mixed mode)
- BEA JRockit
- IBM J9VM
11. 堆
Heap,一个JVM只有一个堆内存,堆内存的大小是可以调节的。
类加载器读取了文件后,一般会把什么东西放到堆中?类,方法,常量,变量~。保存我们所有引用类型的
真实对象;
堆内存中还要细分为三个区域:
- 新生区(伊甸园区) Young/New
- 养老区 old
- 永久区
GC垃圾回收,主要是在伊甸园区和养老区~
假设内存满了,会报OOM错误,堆内存不够!java.lang.OutOfMemoryError: Java heap space
在JDK8以后,永久存储区改了个名字(元空间)。
新生区
- 类:诞生和成长的地方,甚至死亡;
- 伊甸园:所有的对象都是在伊甸园区new 出来的
- 幸存者区 (0,1)
老年区
在伊甸园区new 出的对象,没有死亡,伊甸园区放不下了,保存到幸存区,幸存区也保存不下了,就到老年区了。
永久区
这个区域常驻内存的。用来存放JDK自身携带的Classc对象。Interface元数据,存储的是Java运行时的一些环境或
类信息,这个区域不存在垃圾回收。关闭VM虚拟机就会释放这个区域的内存。
一个启动类,加载了大量的第三方jar包。Tomcat部署了太多的应用,大量动态生成的反射类。不断的被加载。直到
内存满,就会出现OOM;
- jdk1.6之前:永久代,常量池是在方法区;
- jdk1.7 :永久代,但是慢慢的退化了,
去永久代
,常量池在堆中 - jdk1.8之后: 无永久代,常量池在元空间
元空间:逻辑上存在,物理上不存在。
在一个项目中,突然出现了OOM故障,那么该如何排除?研究为什么出错?
- 能够看到代码第几行出错:内存快照分析工具,MAT,Jprofiler
*Debug,一行行分析代码
MAT,Jprofiler作用:
- 分析Dump内存文件,快速定位内存泄露
- 获得堆中的数据
- 获得大的对象
- ....
10. 堆内存调优
设置VM启动参数:
-
-Xms1m -Xmx8m -XX:+HeapDumpOnOutOfMemoryError 输出dump文件
-
-Xms1m -Xmx8m -XX:+PrintGCDetails 打印GC信息
参数说明:
- -Xms 设置初始化内存分配大小 1/64
- -Xmx 设置最大分配内存,默认 1/4
- -XX:+PrintGCDetails 打印GC信息
- -XX:+HeapDumpOnOfMemoryError 当发生OOM错误时,生成dump文件
11. GC
JVM 在进行GC 时,并不是对这三个区域统一回收。大部分时候,回收都是在新生代
- 新生代
- 幸存区 (from ,to)
- 老年区
GC有两种:轻GC(普通GC),重GC(全局GC)
GC面试题:
- JVM的内存模型和分区~详细到每个区放什么?
- 堆里面的分区有哪些?Eden, from,to,老年区,说说他们的特点!
- GC的算法有哪些?标记清除法,标记压缩,复制算法,引用计数法
- 轻 GC
引用计数法:
复制算法:
- 优点:没有内存的碎片
- 缺点:浪费内存空间,多了一半空间永远是空的,to空间永远是空的。假设对象100%存活(极端情况)。
复制算法最佳使用场景:对象存活度较低的时候;新生区~
标记清除算法:
- 优点:不需要额外的内存空间!
- 缺点:两次扫描,严重浪费时间,会产生内存碎片。
标记压缩算法
标记压缩算法是标记清除算法的再优化,防止了内存碎片的产生。
标记清除压缩算法
清除5次~
再压缩~
12. JMM
1.什么是JMM?
JMM: Java Memory Model
2.它干嘛的?
作用:缓存一致性协议,用于定义数据读写的规则
JMM定义了线程工作内存和主内存之间的抽象关系:线程之间的共享变量存储在主内存(Main Memory)中,每个线
程都有一个私有的本地储存(Local Memory)
解决共享对象可见性这个问题:Volilate
3.如何学习
JMM对这八种指令的使用,制定了如下规则:
1)、不允许read和load、store和write操作之一单独出现。即使用了read必须load,使用了store必须write;
2)、不允许线程丢弃他最近的assign操作,即工作变量的数据改变了之后,必须告知主存;
3)、不允许一个线程将没有assign的数据从工作内存同步回主内存;
4)、一个新的变量必须在主内存中诞生,不允许工作内存直接使用一个未被初始化的变量。就是怼变量实施use、store操作之 前,必须经过assign和load操作;
5)、一个变量同一时间只有一个线程能对其进行lock。多次lock后,必须执行相同次数的unlock才能解锁;
6)、如果对一个变量进行lock操作,会清空所有工作内存中此变量的值,在执行引擎使用这个变量前,必须重新load或assign操作初始化变量的值;
7)、如果一个变量没有被lock,就不能对其进行unlock操作。也不能unlock一个被其他线程锁住的变量;
8)、对一个变量进行unlock操作之前,必须把此变量同步回主内存; JMM对这八种操作规则和对volatile的一些特殊规则就能确定哪里操作是线程安全,哪些操作是线程不安全的了。但是这些规则实在复杂,很难在实践中直接分析。所以一般我们也不会通过上述规则进行分析。更多的时候,使用JMM中的happens-before 规则来进行分析。
13. 总结
内存效率:复制算法 > 标记清除算法 > 标记压缩算法 (时间复杂度)
内存整齐度:复制算法 = 标记压缩算法 > 标记清除算法
内存管利用率:标记压缩算法 = 标记清除算法 > 复制算法
思考:难道没有最优的算法吗?
答案:没有,没有最好的算法,只有最合适的算法----> GC:分代收集算法
年轻代:
- 存活率低
- 适合用复制算法
老年代:
- 区域大,存活率高
- 标记清除(内存碎片不是太多) + 标记压缩混合实现