JVM详解(十一)——垃圾回收算法(补充)

一、相关概念

1、System.gc()的理解

  通过System.gc()或Runtime.getRuntime().gc()的调用,会显式触发Full GC,对新生代和老年代进行回收,释放垃圾对象占用的内存。
  然而System.gc()调用附带一个免责声明,它无法保证对垃圾收集器的调用。即:只是告诉JVM希望调用一次,但不保证一定被调用,啥时候调用。
  JVM实现者可以通过System.gc()调用来决定JVM的GC行为,然而一般情况下,垃圾回收应该是自动进行的,无须手动触发,否则就太过于麻烦了。
  代码示例:

 1 public class SystemGCTest {
 2     public static void main(String[] args) {
 3         new SystemGCTest();
 4 
 5         // 提醒jvm的垃圾回收器执行gc,但是不确定是否马上执行gc
 6         System.gc(); // 与Runtime.getRuntime().gc();的作用一样。
 7 
 8         // System.runFinalization(); // 强制调用失去引用的对象的finalize()方法
 9     }
10 
11     @Override
12     protected void finalize() throws Throwable {
13         super.finalize();
14         System.out.println("SystemGCTest 重写了finalize()");
15     }
16 }
17 
18 // 结果
19 SystemGCTest 重写了finalize() // 应该不是每次执行都能打印此结果.
20 
21 // System.gc() 的源码
22 // public static void gc() {
23 //     Runtime.getRuntime().gc();
24 // }

  在执行gc之前,对象的finalize()方法会执行一次。下面这句话就应该会被打印。多运行几次,可能会打印出来,说明了System.gc()方法不一定一定执行GC操作。
  代码示例:手动gc理解不可达对象的回收行为

 1 // -XX:+PrintGCDetails
 2 public class LocalVarGC {
 3     public static void main(String[] args) {
 4         LocalVarGC local = new LocalVarGC();
 5         // 分别执行下面 5 个方法
 6         local.localvarGC1();
 7     }
 8 
 9     // 执行GC,未释放引用.对象直接进入老年代
10     public void localvarGC1() {
11         // 10MB
12         byte[] buffer = new byte[10 * 1024 * 1024];
13         System.gc();
14     }
15     
16     // 执行GC,释放引用.回收空间
17     public void localvarGC2() {
18         byte[] buffer = new byte[10 * 1024 * 1024];
19         buffer = null;
20         System.gc();
21     }
22 
23     // 执行GC,虽然出了buffer作用域,但引用还在.占用了局部变量表的一个slot槽
24     // 未回收空间
25     public void localvarGC3() {
26         {
27             byte[] buffer = new byte[10 * 1024 * 1024];
28         }
29         System.gc();
30     }
31 
32     // 同localvarGC3().但是buffer出了作用域后,slot槽被value复用了
33     // 释放引用.回收空间
34     public void localvarGC4() {
35         {
36             byte[] buffer = new byte[10 * 1024 * 1024];
37         }
38         int value = 10;
39         System.gc();
40     }
41 
42     // localvarGC1()已经执行完了.出栈后,buffer自然释放.
43     // 释放引用.回收空间
44     public void localvarGC5() {
45         localvarGC1();
46         System.gc();
47     }
48 }

2、内存溢出与内存泄漏

  内存溢出:Javadoc中对OOM的解释是,没有空闲内存,并且垃圾收集器也无法提供更多内存。没有空闲内存,原因有:
  (1)Java虚拟机的堆内存设置不够。
  (2)代码中创建了大量大对象,且长时间不能被垃圾收集器收集。
  通常在抛出OOM之间,垃圾收集器会被触发,尽可能的清理空间。比如:在引用机制分析中,JVM会去尝试回收软引用指向的对象等;在java.nio.BIts.reserveMemory()方法中,System.gc()会被调用,以清理空间。
  当然,也不是在任何情况下垃圾收集器都会被触发。比如:分配一个超大对象,已经超过堆的最大值,JVM可以判断出垃圾收集并不能解决这个问题,就会直接抛出OOM。
  内存泄露(Memory Leak):严格来说,只有对象不再被程序用到了,但是GC又不能回收的情况,才叫内存泄漏。但实际上,一些不太好的实践(或疏忽)会导致对象的生命周期变得很长,导致OOM,也可以叫宽泛意义上的"内存泄漏"。
  尽管内存泄漏并不会立刻引起程序崩溃,但是一旦发生,程序中的可用内存就会被逐步蚕食,直至耗尽所有内存,最终出现OOM异常,导致程序崩溃。

  内存泄漏案例:
  (1)单例模式:单例的生命周期和应用程序是一样长的,所以,单例中,如果持有对外部对象的引用的话,那么这个外部对象是不能被回收的,会导致内存泄漏。
  (2)一些提供close的资源未关闭导致内存泄漏:数据库连接,网络连接,io流等,必须手动close,否则是不能被回收的。

3、Stop The World

  STW:指GC发生过程中,会产生应用程序的停顿。停顿时,整个应用程序线程都会被暂停,没有任何响应,有点像卡死的感觉。
  可达性分析算法中,枚举根节点(GC Roots)会导致所有Java执行线程停顿。分析原则:
  (1)分析工作必须在一个能确保一致性的快照中进行。
  (2)一致性指整个分析期间,执行系统看起来像被冻结在某个时间点上。如果分析过程中,对象引用关系还在不断变化,则分析结果的准确性就无法保证。
  被STW中断的应用程序线程会在完成GC之后恢复,频繁中断会让用户感觉像是网速不快造成电影卡顿一样,所以要减少STW的发生。
  STW和采用哪款GC无关,所有的GC都会有。只能说垃圾回收期越来越优秀,回收效率越来越高,尽可能的缩短STW时间。
  STW是JVM在后台自动发起和自动完成的,在用户不可见的情况下,把用户线程全部停掉。
  代码示例:STW

 1 public class StopTheWorldDemo {
 2     public static class WorkThread extends Thread {
 3         List<byte[]> list = new ArrayList<>();
 4 
 5         @Override
 6         public void run() {
 7             try {
 8                 while (true) {
 9                     for (int i = 0; i < 1000; i++) {
10                         byte[] buffer = new byte[1024];
11                         list.add(buffer);
12                     }
13 
14                     if (list.size() > 10000) {
15                         list.clear();
16                         System.gc();// 会触发full gc,进而会出现STW事件
17                     }
18                 }
19             } catch (Exception ex) {
20                 ex.printStackTrace();
21             }
22         }
23     }
24 
25     public static class PrintThread extends Thread {
26         private final long startTime = System.currentTimeMillis();
27 
28         @Override
29         public void run() {
30             try {
31                 while (true) {
32                     // 每间隔 1d 打印一次时间信息
33                     long t = System.currentTimeMillis() - startTime;
34                     System.out.println(t / 1000 + "." + t % 1000);
35                     Thread.sleep(1000);
36                 }
37             } catch (Exception ex) {
38                 ex.printStackTrace();
39             }
40         }
41     }
42 
43     public static void main(String[] args) {
44         WorkThread w = new WorkThread();
45         PrintThread p = new PrintThread();
46         w.start();
47         p.start();
48     }
49 }
50 
51 // 结果
52 不开启w.start()时,理论应该每间隔 1s 打印一次时间信息.事实下面好像有点出入
53 0.1
54 1.2
55 2.3
56 3.3
57 4.3
58 5.4
59 6.4
60 ……
61 
62 开启w.start()时,可以看到明显的卡顿
63 0.6
64 1.6
65 2.6
66 3.7
67 4.9 // 与上一次时间有卡顿
68 5.9
69 6.11
70 7.13
71 ……

4、垃圾回收的并行与并发

  并发:不是真正意义上的"同时进行",只是CPU在多个应用程序之间来回切换,由于CPU处理速度非常快,让用户感觉是在同时进行。

  并行:系统有多个CPU时,一个CPU执行一个进程,另一个CPU执行另一个进程,互不抢占CPU资源,同时进行。
  其实,决定并行的因素不是CPU的数量,而是CPU的核心数量,比如一个CPU多个核也可以并行。

  并发:多个事情,在同一时间段内同时发生。
  并行:多个事情,在同一时间点上同时发生
  并发的多个任务之间是相互抢占资源的,并行的多个任务之间是不相互抢占资源的。只有在多CPU或一个CPU多核的情况下,才会发生并行。否则,看似同时发生的事情,其实都是并发执行的。
  垃圾回收的并行与并发
  并行(Parallel):指多条垃圾收集线程并行工作,但此时用户线程仍处于等待状态。比如:ParNew、Parallel Scavenge、Parallel Old。
  串行(Serial):相较于并行,单线程执行。如果内存不足,则程序暂停,启动JVM垃圾回收器进行垃圾回收,回收完,再启动程序的线程。

  并发(Concurrent):指用户线程与垃圾收集线程同时执行(但不一定是并行的,可能会交替执行),垃圾回收线程在执行时不会停顿用户程序的运行。比如:CMS,G1。

5、安全点与安全区域

  安全点:程序执行时并非在所有地方都能停顿下来GC,只有在特定位置才能停顿下来开始GC,这些位置称为"安全点"。类似于高速路的服务区,并不是所有的地方都能停车,只有到达服务区后,才能停车。
  安全点的选择很重要,如果太少可能导致GC等待时间太长,如果太频繁可能导致运行时的性能问题。大部分指令的执行时间都非常短暂,通常会根据"是否具有让程序长时间执行的特征"为标准。比如选择一些执行时间较长的指令作为安全点,如方法调用,循环跳转,异常处理等。
  如何在GC发生时,检查所有线程都跑到最近的安全点停顿下来呢?
  (1)抢先式中断(目前没有虚拟机采用了):首先中断所有线程,如果还有线程不在安全点,就恢复线程,让线程跑到安全点。
  (2)主动式中断:设置一个中断标志,各个线程运行到安全点的时候主动轮询这个标志。如果中断标志为真,则将自己进行中断挂起。
  安全区域:安全点机制保证了程序执行时,在不太长的时间内就会遇到可进入GC的安全点。但是,程序"不执行"的时候呢?例如线程处于 sleep 状态或 blocked 状态,这时候线程无法响应JVM的中断请求,"走"到安全点去中断挂起,JVM也不太可能等待线程被唤醒。对于这种情况,就需要安全区域来解决。
  安全区域是指在一段代码片段中,对象的引用关系不会发生变化,在这个区域中的任何位置开始GC都是安全的。也可以把安全区域看作是被扩展了的安全点。
  实际执行时,当线程运行到安全区域的代码时,首先标识已经进入了安全区域,如果这段时间内发生GC,JVM会忽略标识为安全区域状态的线程。
  当线程即将离开安全区域时,会检查JVM是否已经完成GC,如果完成了,则继续运行。否则线程必须等待直到收到可以安全离开安全区域的信号为止。

二、再谈引用

  强引用(StrongReference):是指在程序代码中普遍存在的引用赋值,即:Object obj = new Object(),这种引用关系。无论任何情况下,只要引用关系还在,垃圾收集器就永远不会回收掉被引用的对象。
  软引用(SoftReference):系统在发生内存溢出之前,将会把这些对象列入回收范围进行二次回收。如果这次回收后还没有足够的内存,才会抛出内存溢出。
  弱引用(WeakReference):被弱引用关联的对象只能生存到下一次垃圾收集之前。当垃圾收集器工作时,无论内存空间是否足够,都会回收被弱引用关联的对象。
  虚引用(PhantomReference):一个对象是否有虚引用的存在,完全不会对其生存时间造成影响,也无法通过虚引用来获得一个对象的实例。为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时收到一个系统通知。
  99%都是用的强引用;软、弱,用于缓存的场景下;虚引用,主要用于对象回收的跟踪。

1、强引用:不回收

  强引用的对象是可触及的,垃圾收集器永远不会回收被引用的对象。相对的,软引用、弱引用和虚引用的对象是软可触及、弱可触及和虚可触及。在一定条件下,都是可以被回收的。所以,强引用是造成Java内存泄漏的主要原因之一。
  代码示例:强引用

 1 public class StrongReferenceTest {
 2     public static void main(String[] args) {
 3         StringBuffer str = new StringBuffer("Hello world!");
 4         StringBuffer str1 = str;
 5 
 6         str = null;
 7         System.gc();
 8 
 9         try {
10             Thread.sleep(3000);
11         } catch (InterruptedException e) {
12             e.printStackTrace();
13         }
14 
15         // 强引用,不会被回收
16         System.out.println(str1);
17     }
18 }

2、软引用:内存不足才回收

  软引用是用来描述一些还有用,但非必需的对象。只被软引用关联的对象,在系统发生内存溢出前,会把这些对象列进回收范围中进行第二次回收(第一次,指不可达的对象)。如果这次回收还没有足够的内存,才会抛出内存溢出。
  软引用通常用来实现内存敏感的缓存。比如:高速缓存,如果还有空闲内存,就暂时保留缓存,当内存不足时就清理掉。这样就保证了使用缓存的同时,不会耗尽内存。软引用,不会引起OOM。
  内存足够:不会回收软引用的可达对象。
  内存不够:会回收软引用的可达对象。
  代码示例:软引用

 1 // -Xms10m -Xmx10m
 2 public class SoftReferenceTest {
 3 
 4     public static void main(String[] args) {
 5         // 创建对象,建立软引用
 6         SoftReference<User> userSoftRef = new SoftReference<>(new User(1, "haha"));
 7         // 从软引用中重新获得对象
 8         System.out.println(userSoftRef.get());
 9 
10         System.gc();
11         System.out.println("After GC:");
12         // 垃圾回收之后获得软引用中的对象.由于堆空间内存足够,所有不会回收软引用的可达对象。
13         System.out.println(userSoftRef.get());
14 
15         try {
16             // 让系统认为内存资源紧张、不够
17             byte[] b = new byte[1024 * 1024 * 7];
18         } catch (Throwable e) {
19             e.printStackTrace();
20         } finally {
21             // 再次从软引用中获取数据
22             // 在报OOM之前,垃圾回收器会回收软引用的可达对象。
23             System.out.println(userSoftRef.get());
24         }
25     }
26 
27     private static class User {
28         public User(int id, String name) {
29             this.id = id;
30             this.name = name;
31         }
32 
33         public int id;
34         public String name;
35 
36         @Override
37         public String toString() {
38             return "[id=" + id + ", name=" + name + "] ";
39         }
40     }
41 }
42 
43 // 结果
44 [id=1, name=haha] 
45 After GC:
46 [id=1, name=haha] 
47 java.lang.OutOfMemoryError: Java heap space
48     at com.lx.jvm.SoftReferenceTest.main(SoftReferenceTest.java:20)
49 null

3、弱引用:发现即回收

  弱引用也是用来描述非必需对象,只被弱引用关联的对象只能生存到下一次垃圾收集发生为止。在系统GC时,不管堆空间是否足够,都会回收只被弱引用关联的对象。
  但是,由于垃圾回收器的线程优先级通常很低,因此,并不一定能很快的发现持有弱引用的对象。在这种情况下,弱引用对象可以存在较长的时间。
  软、弱引用都非常适合保存那些可有可无的缓存数据。当系统内存不足时,回收缓存数据,不会导致内存溢出;内存充足时,缓存数据可以存在相当长的时间,从而起到加速系统的作用。
  应用:三级缓存,内存—>本地—>网络。用WeakHashMap去存储图片信息,就可以在内存不足的时候,及时回收数据。
  代码示例:弱引用

 1 public class WeakReferenceTest {
 2 
 3     public static void main(String[] args) {
 4         // 构造了弱引用
 5         WeakReference<User> userWeakRef = new WeakReference<>(new User(1, "haha"));
 6         // 从弱引用中重新获取对象
 7         System.out.println(userWeakRef.get());
 8 
 9         System.gc();
10         // 不管当前内存空间足够与否,都会回收它的内存
11         System.out.println("After GC:");
12         // 重新尝试从弱引用中获取对象
13         System.out.println(userWeakRef.get());
14     }
15 
16     private static class User {
17         public User(int id, String name) {
18             this.id = id;
19             this.name = name;
20         }
21 
22         public int id;
23         public String name;
24 
25         @Override
26         public String toString() {
27             return "[id=" + id + ", name=" + name + "] ";
28         }
29     }
30 }
31 
32 // 结果
33 [id=1, name=haha] 
34 After GC:
35 null

4、虚引用:对象回收跟踪

  一个对象是否有虚引用的存在,完全不会决定对象的生命周期。若只有虚引用,那么它和没有引用几乎是一样的,随时都可能被垃圾回收器回收。
  它不能单独使用,也无法通过虚引用来获取被引用的对象。
  为一个对象设置虚引用关联的唯一目的在于跟踪垃圾回收过程。能在这个对象被收集器回收时收到一个系统通知。
  虚引用必须和引用队列一起使用,在创建时必须提供一个引用队列作为参数。当垃圾回收器准备回收一个对象时,如果发现它还有虚引用,就会在回收对象后,将这个虚引用加入引用队列,以通知应用程序对象的回收情况。
  由于虚引用可以跟踪对象的回收时间,因此,也可以将一些资源释放操作放置在虚引用中执行和记录。
  代码示例:虚引用

 1 public class PhantomReferenceTest {
 2     public static PhantomReferenceTest obj;
 3     // 引用队列
 4     static ReferenceQueue<PhantomReferenceTest> phantomQueue = null;
 5 
 6     public static class CheckRefQueue extends Thread {
 7         @Override
 8         public void run() {
 9             while (true) {
10                 if (phantomQueue != null) {
11                     PhantomReference<PhantomReferenceTest> objt = null;
12                     try {
13                         objt = (PhantomReference<PhantomReferenceTest>) phantomQueue.remove();
14                     } catch (InterruptedException e) {
15                         e.printStackTrace();
16                     }
17                     if (objt != null) {
18                         System.out.println("追踪垃圾回收过程:PhantomReferenceTest实例被GC了");
19                     }
20                 }
21             }
22         }
23     }
24 
25     @Override
26     protected void finalize() throws Throwable {
27         super.finalize();
28         System.out.println("调用当前类的finalize()方法");
29         obj = this;
30     }
31 
32     public static void main(String[] args) {
33         Thread t = new CheckRefQueue();
34         t.setDaemon(true); // 设置为守护线程:当程序中没有非守护线程时,守护线程也就执行结束。
35         t.start();
36 
37         phantomQueue = new ReferenceQueue<>();
38         obj = new PhantomReferenceTest();
39         // 构造对象的虚引用,并指定了引用队列
40         PhantomReference<PhantomReferenceTest> phantomRef = new PhantomReference<>(obj, phantomQueue);
41 
42         try {
43             // 不可获取虚引用中的对象
44             System.out.println(phantomRef.get());
45 
46             // 将强引用去除
47             obj = null;
48             // 第一次进行GC,由于对象可复活,GC无法回收该对象
49             System.gc();
50             Thread.sleep(1000);
51             if (obj == null) {
52                 System.out.println("obj 是 null");
53             } else {
54                 System.out.println("obj 复活");
55             }
56 
57             System.out.println("第 2 次 gc");
58             obj = null;
59             System.gc(); // 一旦将obj对象回收,就会将此虚引用存放到引用队列中。
60             Thread.sleep(1000);
61             if (obj == null) {
62                 System.out.println("obj 是 null");
63             } else {
64                 System.out.println("obj 可用");
65             }
66         } catch (InterruptedException e) {
67             e.printStackTrace();
68         }
69     }
70 }

5、终结器引用

  它用以实现对象的finalize()方法。无需手动编码,其内部配合引用队列使用。在GC时,终结器引用入队,由Finalizer线程通过终结器引用找到被引用对象并调用它的finalize()方法,第二次GC时才能回收被引用对象。

posted @ 2021-10-28 09:47  Craftsman-L  阅读(127)  评论(0编辑  收藏  举报