JVM系列【6】GC与调优3 - kongxubihai

公告

JVM系列【6】GC与调优3

JVM系列笔记目录

虚拟机的基础概念

class文件结构

class文件加载过程

jvm内存模型

JVM常用指令

GC与调优

调优前的基础概念

吞吐量：用户代码时间 /（用户代码执行时间 + 垃圾回收时间）
响应时间：STW越短，响应时间越好
所谓调优，首先确定，追求啥？吞吐量优先，还是响应时间优先？还是在满足一定的响应时间的情况下，要求达到多大的吞吐量。如科学计算、数据挖掘：吞吐量优先;网站、GU、 API 等追求响应时间。

什么是调优

根据需求进行JVM规划和预调优
优化JVM运行环境(慢、卡顿)
解决JVM运行过程中出现的各种问题(如OOM)

根据需求进行JVM规划和预调优

调优一般来说，从业务场景开始，没有业务场景的调优都是耍流氓；无监控（压力测试，能看到结果），不调优。

步骤
1. 熟悉业务场景
2. 选择回收器组合，没有最好的GC,只有最适合的GC。追求响应时间或停顿时间选择CMS、G1、ZGC追求吞吐量可选择PS。
3. 计算内存需求（经验值 1.5G -16G）
4. 选定CPU（越高越好）
5. 设定年代大小，升级年代
6. 设定日志参数，日志文件全放一个？10T日志怎么查。可以设置滚动日志如 -Xloggc:/opt/xxx/logs/xxx-xxx-gc-%t.log -XX:+UseGCLogFileRotation -XX:NumberOfGCLogFiles=5 -XX:GCLogFileSize=20M -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintGCCause，或是每天产生一个日志文件。
7. 观察日志情况
提供一个简单的案例分析

案例1：垂直电商，最高每日百万订单，处理订单系统需要什么样的服务器配置？

这个问题比较业余，因为很多不同的服务器配置都能支撑(1.5G -16G)。可以具体分析：一天中特定的高峰期1小时有360000订单集， 1000个订单/秒，可以根据经验值估算需要的内存配置。如果非要要计算，可以这么算：一个订单产生需要多少内存？512K * 1000，需要500M内存。

从另外专业的角度考虑：要求响应时间100ms，这种情况下可以通过压测的方式找到符合的服务器配置。
优化JVM运行环境(慢、卡顿)
1. 提供一个简单的案例分析。
  有一个50万PV的资料类网站（从磁盘提取文档到内存）原服务器32位，1.5G的堆.用户反馈网站比较缓慢，因此公司决定升级。新的服务器为64位，16G的堆内存，结果用户反馈卡顿十分严重，反而比以前效率更低了。
  1. 为什么原网站慢?很多用户浏览数据，很多数据load到内存，内存不足，频繁GC，STW长，响应时间变慢。
  2. 为什么会更卡顿？内存越大，FGC时间越长
  3. 如何解决？可以换垃圾回收器，如从PS 换为PN + CMS 或者是1.8以上的直接用G1。
2. 系统CPU经常100%，如何调优？(面试高频)
  CPU100%那么一定有线程在占用系统资源，
  1. 找出哪个进程cpu高（top）
  2. 该进程中的哪个线程cpu高（top -Hp）
  3. 导出该线程的堆栈 (jstack)
  4. 查找哪个方法（栈帧）消耗时间长 (jstack)
  5. 对比工作线程占比高还是垃圾回收线程占比高
3. 系统内存飙高，如何调优（面试高频）
  
  思路：导出堆内存(jmap); 使用工具如(jhat jvisualvm mat jprofiler)分析
解决JVM运行过程中出现的各种问题

提供一个测试案例来说明分析过程和常用的工具，代码如下：
```
/**
 * 从数据库中读取信用数据，套用模型，并把结果进行记录和传输
 */

public class T15_FullGC_Problem01 {

    private static class CardInfo {
        BigDecimal price = new BigDecimal(0.0);
        String name = "张三";
        int age = 5;
        Date birthdate = new Date();

        public void m() {}
    }

    private static ScheduledThreadPoolExecutor executor = new ScheduledThreadPoolExecutor(50,
            new ThreadPoolExecutor.DiscardOldestPolicy());

    public static void main(String[] args) throws Exception {
        executor.setMaximumPoolSize(50);

        for (;;){
            modelFit();
            Thread.sleep(100);
        }
    }

    private static void modelFit(){
        List<CardInfo> taskList = getAllCardInfo();
        taskList.forEach(info -> {
            // do something
            executor.scheduleWithFixedDelay(() -> {
                //do sth with info
                info.m();

            }, 2, 3, TimeUnit.SECONDS);
        });
    }

    private static List<CardInfo> getAllCardInfo(){
        List<CardInfo> taskList = new ArrayList<>();

        for (int i = 0; i < 100; i++) {
            CardInfo ci = new CardInfo();
            taskList.add(ci);
        }

        return taskList;
    }
}
```
1. 启动命令java -Xms20M -Xmx20M -XX:+UseParallelGC -XX:+HeapDumpOnOutOfMemoryError T15_FullGC_Problem01
2. 一般是运维团队首先受到报警信息（CPU、Memory）
3. top命令观察到问题：内存不断增长，CPU占用率居高不下
4. top -Hp 观察进程中的线程，哪个线程CPU和内存占比高
5. jps定位具体java进程；jstack pid 定位线程状况，重点关注：WAITING BLOCKED
  
  waiting on <0x0000000088ca3310> (a java.lang.Object)
  假如有一个进程中100个线程，很多线程都在waiting on ，一定要找到是哪个线程持有这把锁。怎么找？搜索jstack dump的信息，找，看哪个线程持有这把锁处于RUNNABLE状态。
6. jinfo pid 查看JVM的情况，一般用处不大。
7. 通过jstat -gc 动态观察gc情况；或是阅读GC日志发现频繁GC；或是通过arthas观察gc情况。
8. 在线定位，查找有多少对象产生，注意大量的对象，使用jmap -histo pid |head -20
9. jmap -dump:format=b,file=xxx pid 可以在线堆转储，但是要慎重影响很大。
  
  线上系统内存特别大，jmap执行期间对进程产生很大影响，甚至卡顿(电商不适合)。
  
  如何解决？启动时候设定参数HeapDumpOnOutOfMemoryError，OOM的时候会自动产生堆转储文件；如果线上很多服务器备份(高可用)，停掉这台服务器对其它服务没影响也可以在线堆转储；在线定位也可以用阿里的arthas。
10. 使用MAT/jhat/jvisualvm 进行dump文件分析。
  
  建议使用MAT/jvisualvm 装入分析，界面友好且支持复杂查询
11. 最难的一点：定位到代码中的问题
  
  示例代码的问题是：线程池使用不当引起OOM；不停new CardInfo对象不停地起定时线程去处理，导致这些对象越来越多

知识分享，转载请注明出处。学无先后，达者为先！

posted on 2020-10-17 20:48 kongxubihai 阅读(224) 评论(0) 编辑收藏举报

刷新页面返回顶部

kongxubihai

公告

JVM系列笔记目录

调优前的基础概念

什么是调优

根据需求进行JVM规划和预调优

优化JVM运行环境(慢、卡顿)

解决JVM运行过程中出现的各种问题