17.JVM
一、JVM探究
- 谈谈对JVM的理解?
- Java文件--编译--》class文件----》JVM加载运行
- Java8虚拟机和之前的变化更新?
- 什么是内存溢出OOM?什么是栈溢出StackOverFlowError?怎么分析?
- JVM的常用调优参数有哪些?
- 一般扩大运行时的内存
- 内存快照如何抓取?怎么分析Dump文件?
- 谈谈JVM中类加载器?
1.JVM的位置#
- JVM在操作系统之上
2.JVM的体系结构#
1. JVM结构图#
2. JVM垃圾回收#
- 垃圾回收,指的是堆内存的垃圾回收
3. JVM调优#
- 方法区是特殊的堆
- JVM调优,99%是调堆
3.类加载器#
- 虚拟机自带的加载器
- 启动类(根)加载器(BootstrapClassloader)
- 扩展类加载器(ExtClassloader)
- 应用程序(系统类)加载器(AppClassloader)
/**
* 类加载器
*/
public class A_ClassLoader {
public static void main(String[] args) {
//类是模板,对象是具体的
Class<Car> aClass = Car.class; //模板反射对象,全局唯一
//名字在栈里,真正的数据引用在堆里
Car car1 = new Car();
Car car2 = new Car();
Car car3 = new Car();
//不同的对象
System.out.println(car1.hashCode());
System.out.println(car2.hashCode());
System.out.println(car3.hashCode());
//返回类的模板对象
Class<? extends Car> carClass1 = car1.getClass();
Class<? extends Car> carClass2 = car2.getClass();
Class<? extends Car> carClass3 = car3.getClass();
//同一个模板
System.out.println(carClass1.hashCode());
System.out.println(carClass2.hashCode());
System.out.println(carClass3.hashCode());
//类加载器
ClassLoader classLoader = carClass1.getClassLoader();
System.out.println(classLoader); //AppClassloader:\jre\lib\rt.jar(java.lang.ClassLoader)
System.out.println(classLoader.getParent()); //ExtClassloader:\jre\lib\ext
System.out.println(classLoader.getParent().getParent()); //null(1.不存在;2.Java程序获取不到):\jre\lib\rt.jar
}
}
class Car {
}
4.双亲委派机制#
-
为了保证安全
- App--》Exc--》Boot(最终执行根加载器)
- 根加载器中没有就会逐级往下找:Boot--》Exc--》App(当前应用)
-
执行步骤:
- 类加载器收到类加载的请求
- 将这个请求向上委托给父类加载器去完成,一直向上委托,直到启动类加载器
- 启动类加载器检查是否能够加载当前这个类,能加载就结束,使用当前的加载器,否则抛出异常,通知子加载器进行加载
- 重复步骤3
package java.lang;
/**
* 双亲委派机制
* 自定义一个与Java中的String同包同名的类
*/
public class String {
@Override
public String toString() {
return "双亲委派机制";
}
public static void main(String[] args) {
String s = new String();
/*
错误: 在类 java.lang.String 中找不到 main 方法, 请将 main 方法定义为:
public static void main(String[] args)
否则 JavaFX 应用程序类必须扩展javafx.application.Application
*/
s.toString();
}
}
5.沙箱安全机制#
-
Java安全模型的核心就是Java沙箱(Sandbox),什么是沙箱?沙箱是一个限制程序运行的环境。沙箱机制就是将Java代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。沙箱主要限制系统资源访问,那系统资源包括什么?CPU、内存、文件系统、网络。不同级别的沙箱对这些资源访问的限制也可以不一样
-
所有的Java程序运行都可以指定沙箱,可以定制安全策略
-
在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙箱(Sandbox)机制。如下图所示JDK1.0安全模型
-
但如此严格的安全机制也给程序的功能扩展带来障碍,比如当用户希望远程代码访问本地系统的文件时候,就无法实现。因此在后续的Java1.1版本中,针对安全机制做了改进,增加了安全策略,允许用户指定代码对本地资源的访问权限。如下图所示JDK1.1安全模型
-
在Java1.2版本中,再次改进了安全机制,增加了代码签名。不论本地代码或是远程代码,都会按照用户的安全策略设定,由类加载器加载到虚拟机中权限不同的运行空间,来实现差异化的代码执行权限控制。如下图所示JDK1.2安全模型
-
当前最新的安全机制实现,则引入了域(Domain)的概念。虚拟机会把所有代码加载到不同的系统域和应用域,系统域部分专门负责与关键资源进行交互,而各个应用域部分则通过系统域的部分代理来对各种需要的资源进行访问。虚拟机中不同的受保护域(Protected Domain),对应不一样的权限(Permission)。存在于不同域中的类文件就具有了当前域的全部权限,如下图所示最新的安全模型JDK1.6安全模型
-
组成沙箱的基本组件
-
字节码校验器(bytecode verifier):确保Java类文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类
-
类裝载器(class loader):其中类装载器在3个方面对Java沙箱起作用:
- 防止恶意代码去干涉善意的代码(双亲委派机制)
- 守护了被信任的类库边界(双亲委派机制)
- 将代码归入保护域,确定了代码可以进行哪些操作(沙箱安全机制)
虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成, 每一个被装载的类将有一个名字,这个命名空间是由Java虚拟机为每一个类装载器维护的,它们互相之间甚至不可见
类装载器采用的机制是双亲委派模式
- 从最内层JVM自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用
- 由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内层类,破坏代码就自然无法生效
- 存取控制器(access controller):存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定
- 安全管理器(security manager):是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高
- 安全软件包(security package):java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括:
- 安全提供者
- 消息摘要
- 数字签名
- 加密
- 鉴别
-
6.native
#
- 比如在
Thread
类中定义了一个像接口一样的方法private native void start0();
- 凡是带了
native
关键字的,说明Java的作用范围达不到了,会去调用底层C语言的库,会进入本地方法栈,通过本地方法接口(JNI),调用本地方法库- JNI(Java Native Interface)作用:扩展Java的使用,融合不同的编程语言为Java所用,Java诞生的时候C/C++横行,想要立足,必须要有调用C/C++的程序,于是就在内存区域中专门开辟了一块标记区域:本地方法栈,为了登记
native
方法,在最终执行的时候,通过本地方法接口(JNI),加载本地方法库中的方法
- JNI(Java Native Interface)作用:扩展Java的使用,融合不同的编程语言为Java所用,Java诞生的时候C/C++横行,想要立足,必须要有调用C/C++的程序,于是就在内存区域中专门开辟了一块标记区域:本地方法栈,为了登记
- 应用:Java程序驱动打印机、Java系统管理生产设备、
Robot
,在企业级应用中较为少见 - 调用其它接口:
Socket
、WebService
、http
7.PC寄存器#
- 程序计数器(Program Counter Register):每个线程都有一个程序计数器,是线程私有的,就是一个指针,指向方法区中的方法字节码(用来存储指向像一条指令的地址,也即将要执行的指令代码),在执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不计
8.方法区#
- 方法区(Method Area)是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间
- 静态变量、常量、类信息(构造方法、接口定义)、运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关(
static
、final
、Class
模板、常量池)
9.栈(数据结构)#
-
程序=数据结构+算法
-
栈:先进后出、后进先出(桶)
-
队列:先进先出(FIFO:First Input First Output)
-
为什么
main()
先执行,最后结束?- 有一个栈,程序要执行是栈里面的东西,栈如果是空的程序结束。第一步,把
main()
方法压入栈,然后调用其他方法把其它方法压在main()
方法上面,其它方法执行完会被弹出栈,最后弹出main()
方法,main()
方法结束程序就结束了
- 有一个栈,程序要执行是栈里面的东西,栈如果是空的程序结束。第一步,把
-
栈(栈内存):主管程序的运行,生命周期和线程同步,线程结束,栈内存也就释放,对于栈来说,不存在垃圾回收问题,一旦线程结束,栈就结束
-
栈中存放内容:8大基本类型、对象引用、实例的方法(具体怎么存)
-
栈运行原理:栈帧(栈满了:StackOverflowError)
-
栈+堆+方法区的交互关系
-
对象在内存中实例化的过程?
10.三种JVM#
- Sun公司的HotSpot(
java -version
查看:Java HotSpot(TM) 64-Bit Server VM (build 25.131-b11, mixed mode)
) - BEA公司的JRockit(是世界上最快的JVM,适合财务前端办公、军事指挥与控制和电信网络的需要)
- IBM公司的J9VM
11.堆#
-
堆(Heap),一个JVM只有一个堆内存,堆内存的大小是可以调节的
-
类加载器读取了类文件后,一般会把类、方法、常量、变量放到堆中(栈中一般是引用,常量池都在方法区),保存所有引用类型的真实对象
-
堆内存中还要细分为三个区域:
- 新生区(伊甸园区)(Young/New)
- 养老区(Old)
- 永久区(Perm)
-
GC垃圾回收,主要是在伊甸园区和养老区
-
假设内存满了(OOM),堆内存不够(
java.lang.OutOfMemoryError: Java heap space
) -
在JDK8以后,永久存储区改了个名字(元空间)
1.新生区#
- 类诞生和成长的地方,甚至死亡
- 分为伊甸园区和幸存者区(0区和1区),所有的对象都是在伊甸园区new出来的
- 假设伊甸园区大小是10个,等到伊甸园区满的时候,会触发轻量GC,删除了9个,幸存了1个进入幸存者0区。那么此时伊甸园区又有10个空位置了(幸存者0区和幸存者1区是来回交换的,不是不变的),等到幸存者0区和幸存者1区都满了,触发重GC,留下来的存到养老区
- 99%的对象都是临时对象,在伊甸园区就结束了,很少看到OOM报错(可以新建一个字符串,一直往上加字符,加到报OOM)
2.老年区#
- 新生区剩下来的,被淘汰的
3.永久区#
-
这个区域是常驻内存的。用来存放JDK自身携带的Class对象、Interface元数据,存储的是Java运行时的一些环境或类信息。这个区域不存在垃圾回收。关闭JVM虚拟机就会释放这个区域的内存
-
不同版本的永久区
- JDK1.6之前:永久代,常量池是在方法区
- JDK1.7:永久代,但是慢慢的退化了,去永久代,常量池在堆中
- JDK1.8之后:无永久代,常量池在元空间
-
永久区溢出案例:
- 如果一个启动类,加载了大量的第三方jar包
- Tomcat部署了太多的应用
- 大量动态生成的反射类,不断的被加载,直到内存满,就会出现OOM(Out of Memory)
-
元空间:逻辑上存在,物理上不存在(因为存储在本地磁盘内)所以最后并不算在JVM虚拟机内存中
-
默认情况下,分配的总内存是电脑内存的1/4,是初始化内存的1/64
/** * 默认情况下,分配的总内存是电脑内存的1/4,是初始化内存的1/64 */ public class C_Heap { public static void main(String[] args) { //虚拟机试图使用的最大内存(字节) long maxMemory = Runtime.getRuntime().maxMemory(); System.out.println(maxMemory + "字节," + (maxMemory / (double) 1024 / 1024) + "MB"); //虚拟机初始化的总内存(字节) long totalMemory = Runtime.getRuntime().totalMemory(); System.out.println(totalMemory + "字节," + (totalMemory / (double) 1024 / 1024) + "MB"); /* 1029177344字节,981.5MB 1029177344字节,981.5MB 堆:Heap 新生区:PSYoungGen total 305664K, used 20971K [0x00000000eab00000, 0x0000000100000000, 0x0000000100000000) 伊甸园区:eden space 262144K, 8% used [0x00000000eab00000,0x00000000ebf7afb8,0x00000000fab00000) 幸存者区(0/1):from space 43520K, 0% used [0x00000000fd580000,0x00000000fd580000,0x0000000100000000) 幸存者区(1/0):to space 43520K, 0% used [0x00000000fab00000,0x00000000fab00000,0x00000000fd580000) 养老区:ParOldGen total 699392K, used 0K [0x00000000c0000000, 0x00000000eab00000, 0x00000000eab00000) object space 699392K, 0% used [0x00000000c0000000,0x00000000c0000000,0x00000000eab00000) 元空间:Metaspace used 3516K, capacity 4500K, committed 4864K, reserved 1056768K class space used 389K, capacity 392K, committed 512K, reserved 1048576K 新生区 + 养老区:305664K + 699392K = 1005056K = 981.5M */ } }
-
分析OOM:
4.堆内存调优#
-
使用JProfiler工具分析OOM原因
-
在一个项目中,突然出现了OOM故障,那么该如何排除,研究为什么出错
- 快速排错:能够看到代码第几行出错(内存快照分析工具)
- MAT是eclipse集成使用
- Jprofiler
- 慢速排错:Debug,一行行分析代码
- 快速排错:能够看到代码第几行出错(内存快照分析工具)
-
MAT和Jprofiler的作用:
- 分析Dump内存文件,快速定位内存泄露
- 获得堆中的数据
- 获得大的对象
- ……
-
Jprofile使用:
-
在idea中下载JProfiler插件
-
联网下载JProfiler客户端,安装
-
在idea中配置JProfiler可执行文件
-
编写一段引发OOM的代码
/** * 一段引发OOM的代码 */ public class D_OOM { public static void main(String[] args) { byte[] bytes = new byte[1 * 1024 * 1024]; //1MB List<Object> list = new ArrayList<>(); // int count = 0; //计数 //引发OOM的代码,一般都是死循环 try { while (true) { list.add(bytes); //问题所在 count++; } } catch (Error e) { //使用Exception捕获不到,需要使用Error System.out.println("count:" + count); e.printStackTrace(); } /* java.lang.OutOfMemoryError: Java heap space Dumping heap to java_pid21552.hprof ...(Dump的文件在当前类文件的src文件夹的上一级中的java_pid21552.hprof) Heap dump file created [6873402 bytes in 0.014 secs] count:540217 java.lang.OutOfMemoryError: Java heap space at java.util.Arrays.copyOf(Arrays.java:3210) at java.util.Arrays.copyOf(Arrays.java:3181) at java.util.ArrayList.grow(ArrayList.java:261) at java.util.ArrayList.ensureExplicitCapacity(ArrayList.java:235) at java.util.ArrayList.ensureCapacityInternal(ArrayList.java:227) at java.util.ArrayList.add(ArrayList.java:458) at com.minami.D_OOM.main(D_OOM.java:18) */ } }
-
在idea中VM options中写参数,系统OOM会Dump文件
-Xms1m -Xmx8m -XX: +HeapDumpOnOutOfMemoryError # -Xms 设置初始化内存分配大小,默认1/64 # -Xmx 设置最大分配内存,默以1/4 # -XX: +HeapDumpOnOutOfMemoryError 打印OOM Dump信息 # -XX: +PrintGCDetails 打印GC垃圾回收信息
-
控制台打印Dump文件名,找到文件双击打开,运行程序后在jprofile客户端中找到错误
-
13.GC:垃圾回收#
1.垃圾回收的区域#
- JVM会自动进行垃圾回收,手动只能提醒
- JVM在进行GC时,并不是对这三个区域(新生代(伊甸区和幸存区from/to)、老年区)统一回收。大部分时候,都是回收新生代
- GC有两种类型:
- 轻GC(Minor GC,普通GC):只针对新生代,偶尔走一下幸存区
- 重GC(Major GC,全局GC):清理所有东西
- 常见面试题:
- JVM的内存模型和分区,详细到每个区放什么?
- 堆里面的分区有哪些?说说他们的特点(Eden、from、to、Old)
- GC的常用算法?怎么用?(标记清除法、标记整理(压缩)法、复制算法、引用计数法)
- 轻GC和重GC分别在什么时候发生?
2.常用算法#
1.引用计数法#
2.复制算法#
-
空的始终都是to。当幸存0和幸存1区都有一个的话,就把其中一个复制到另一个,这样,有两个对象的是from,空的是to。要是把from中的两个复制到to中,那么to就变成了from,from就变成了to。每次垃圾清理完之后,伊甸园区空,to区空了。其中的对象等到15次后,进入到养老区
-
优点:没有内存的碎片(不会把东西乱放)
-
缺点:浪费了内存空间(多了一半空间to永远是空)。假设对象100%存活(极端情况),不适合使用复制算法
-
最佳使用场景:对象存活度较低的时候(新生区)
3.标记清除法#
-
回收垃圾时,扫描这些对象,对活着的对象进行标记。清除的时候,对没有标记的对象,进行清除
-
优点:不需要额外的空间
-
缺点:两次扫描,严重浪费时间,会产生内存碎片(对象存储的时候用hash,找内存也需要时间成本,对象位置很散乱,当堆中的有效内存被标记满的时候,就会停止程序)
4.标记清除压缩法#
5.总结#
-
内存效率(时间复杂度 ):复制算法 > 标记清除法 > 标记压缩法
-
内存整齐度:复制算法 = 标记压缩法 > 标记清除法
-
内存利用率:标记压缩法 = 标记清除法 > 复制算法
-
最优算法:没有最好的算法,只有最合适的算法
-
GC(分代收集算法):不同位置用不同的垃圾收集算法
-
年轻代:存活率低,使用复制算法
-
老年代:区域大,存活率高,使用标记清除(内存碎片不是太多)+标记压缩(内存碎片到达一定量级)混合实现
-
-
所谓的JVM调优就是在调这些东西,根据实际情况,标记清除算法导致的内存碎片不是太多的情况就继续标记清除,直到最后碎片太多到达一定程序就标记压缩
14.JMM(Java Memory Model):Java内存模型#
1.什么是JMM#
- JMM(Java Memory Model):Java内存模型
2.JMM的作用#
- 作用:缓存一致性的协议,用于定义数据读写的规则
- JMM定义了线程工作内存和主内存的抽象关系:线程之间的共享变量存储在主内存中(Main Memory),每个线程都有一个私有的本地内存(Local Memory)
- 使用
volatile
关键字来解决共享对象可见性的问题
- 使用
- Java内存模型是围绕着并发编程中原子性、可见性、有序性这三个特征来建立的
3.内存交互操作#
-
内存交互操作有8种,虚拟机实现必须保证每一个操作都是原子的,不可再分的(对于double和long类型的变量来说,load、store、read和write操作在某些平台上允许例外)
-
lock(锁定):作用于主内存的变量,把一个变量标识为线程独占状态
-
unlock(解锁):作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定
-
read(读取):作用于主内存变量,它把一个变量的值从主内存传输到线程的工作内存中,以便随后的load动作使用
-
load(载入):作用于工作内存的变量,它把read操作从主存中变量放入工作内存中
-
use(使用):作用于工作内存中的变量,它把工作内存中的变量传输给执行引擎,每当虚拟机遇到一个需要使用到变量的值,就会使用到这个指令
-
assign(赋值):作用于工作内存中的变量,它把一个从执行引擎中接受到的值放入工作内存的变量副本中
-
store(存储):作用于主内存中的变量,它把一个从工作内存中一个变量的值传送到主内存中,以便后续的write使用
-
write(写入):作用于主内存中的变量,它把store操作从工作内存中得到的变量的值放入主内存的变量中
-
-
JMM对这八种指令的使用,制定了如下规则:
- 不允许read和load、store和write操作之一单独出现。即使用了read必须load,使用了store必须write
- 不允许线程丢弃他最近的assign操作,即工作变量的数据改变了之后,必须告知主存
- 不允许一个线程将没有assign的数据从工作内存同步回主内存
- 一个新的变量必须在主内存中诞生,不允许工作内存直接使用一个未被初始化的变量。就是对变量实施use、store操作之前,必须经过assign和load操作
- 一个变量同一时间只有一个线程能对其进行lock。多次lock后,必须执行相同次数的unlock才能解锁
- 如果对一个变量进行lock操作,会清空所有工作内存中此变量的值,在执行引擎使用这个变量前,必须重新load或assign操作初始化变量的值
- 如果一个变量没有被lock,就不能对其进行unlock操作。也不能unlock一个被其他线程锁住的变量
- 对一个变量进行unlock操作之前,必须把此变量同步回主内存
-
JMM对这八种操作规则和对volatile的一些特殊规则就能确定哪里操作是线程安全,哪些操作是线程不安全的了。但是这些规则实在复杂,很难在实践中直接分析。所以一般我们也不会通过上述规则进行分析。更多的时候,使用java的happen-before规则来进行分析
作者:n-ning-g
出处:https://www.cnblogs.com/n-ning-g/p/17818452.html
版权:本作品采用「署名-非商业性使用-相同方式共享 4.0 国际」许可协议进行许可。
备注:你可以在这里自定义其他内容,支持 HTML
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Blazor Hybrid适配到HarmonyOS系统
· Obsidian + DeepSeek:免费 AI 助力你的知识管理,让你的笔记飞起来!
· 分享4款.NET开源、免费、实用的商城系统
· 解决跨域问题的这6种方案,真香!
· 一套基于 Material Design 规范实现的 Blazor 和 Razor 通用组件库