web服务之Tomcat性能优化JVM

Tomcat 性能优化

在目前流行的互联网架构中,Tomcat在目前的网络编程中是举足轻重的,由于Tomcat的运行依赖于
JVM,从虚拟机的角度把Tomcat的调整分为外部环境调优 JVM 和 Tomcat 自身调优两部分

JVM组成

JVM 组成部分
类加载子系统: 使用Java语言编写.java Source Code文件,通过javac编译成.class Byte Code文
件。class loader类加载器将所需所有类加载到内存,必要时将类实例化成实例
运行时数据区: 最消耗内存的空间,需要优化
执行引擎: 包括JIT (JustInTimeCompiler)即时编译器, GC垃圾回收器
本地方法接口: 将本地方法栈通过JNI(Java Native Interface)调用Native Method Libraries, 比
如:C,C++库等,扩展Java功能,融合不同的编程语言为Java所用

JVM运行时数据区域由下面部分构成:

Method Area (线程共享):方法区是所有线程共享的内存空间,存放已加载的类信息(构造方法,接口定义),常量(final),静态变量(static), 运行时常量池等。但实例变量存放在堆内存中. 从JDK8开始此
空间由永久代改名为元空间

heap (线程共享):堆在虚拟机启动时创建,存放创建的所有对象信息。如果对象无法申请到可用内存将抛出OOM异常.堆是靠GC垃圾回收器管理的,通过-Xmx -Xms 指定最大堆和最小堆空间大小

Java stack (线程私有):Java栈是每个线程会分配一个栈,存放java中8大基本数据类型,对象引用,实例的本地变量,方法参数和返回值等,基于FILO()(First In Last Out),每个方法为一个栈帧

Program Counter Register(线程私有):PC寄存器就是一个指针,指向方法区中的方法字节码,每一个线程用于记录当前线程正在执行的字节码指令地址。由执行引擎读取下一条指令.因为线程需要
切换,当一个线程被切换回来需要执行的时候,知道执行到哪里了

Native Method stack(线程私有):本地方法栈为本地方法执行构建的内存空间,存放本地方法执行时的局部变量、操作数等。

所谓本地方法,使用native 关健字修饰的方法,比如:Thread.sleep方法. 简单的说是非Java实现的方
法,例如操作系统的C编写的库提供的本地方法,Java调用这些本地方法接口执行。但是要注意,
本地方法应该避免直接编程使用,因为Java可能跨平台使用,如果用了Windows API,换到了
Linux平台部署就有了问题

GC (Garbage Collection) 垃圾收集器

在堆内存中如果创建的对象不再使用,仍占用着内存,此时即为垃圾.需要即使进行垃圾回收,从而释放内存
空间给其它对象使用
其实不同的开发语言都有垃圾回收问题,C,C++需要程序员人为回收,造成开发难度大,容易出错等问题,但
执行效率高,而JAVA和Python中不需要程序员进行人为的回收垃圾,而由JVM或相关程序自动回收垃圾,减
轻程序员的开发难度,但可能会造成执行效率低下
堆内存里面经常创建、销毁对象,内存也是被使用、被释放。如果不妥善处理,一个使用频繁的进程,
可能会出现虽然有足够的内存容量,但是无法分配出可用内存空间,因为没有连续成片的内存了,内存
全是碎片化的空间。
所以需要有合适的垃圾回收机制,确保正常释放不再使用的内存空间,还需要保证内存空间尽可能的保持一
定的连续

对于垃圾回收,需要解决三个问题

哪些是垃圾要回收
怎么回收垃圾
什么时候回收垃圾

Garbage 垃圾确定方法

引用计数: 每一个堆内对象上都与一个私有引用计数器,记录着被引用的次数,引用计数清零,该
对象所占用堆内存就可以被回收。循环引用的对象都无法将引用计数归零,就无法清除。Python中
即使用此种方式

根搜索(可达)算法 Root Searching

垃圾回收基本算法

标记-清除 Mark-Sweep

分垃圾标记阶段和内存释放阶段。标记阶段,找到所有可访问对象打个标记。清理阶段,遍历整个堆,对未标记对象(即不再使用的对象)逐一进行清理。

标记-清除最大的问题会造成内存碎片,但是不浪费空间,效率较高(如果对象较多,逐一删除效率也会影响)

标记-压缩 (压实)Mark-Compact

分垃圾标记阶段和内存整理阶段。标记阶段,找到所有可访问对象打个标记。内存清理阶段时,整理时将对象向内存一端移动,整理后存活对象连续的集中在内存一端。

标记-压缩算法好处是整理后内存空间连续分配,有大段的连续内存可分配,没有内存碎片。
缺点是内存整理过程有消耗,效率相对低下

复制 Copying

先将可用内存分为大小相同两块区域A和B,每次只用其中一块,比如A。当A用完后,则将A中存活的对
象复制到B。复制到B的时候连续的使用内存,最后将A一次性清除干净。
缺点是比较浪费内存,只能使用原来一半内存,因为内存对半划分了,复制过程毕竟也是有代价。

好处是没有碎片,复制过程中保证对象使用连续空间,且一次性清除所有垃圾,所以效率很高

多种算法总结

没有最好的算法,在不同场景选择最合适的算法

效率: 复制算法>标记清除算法> 标记压缩算法
内存整齐度: 复制算法=标记压缩算法> 标记清除算法
内存利用率: 标记压缩算法=标记清除算法>复制算法

STW

对于大多数垃圾回收算法而言,GC线程工作时,停止所有工作的线程,称为Stop The World。GC 完成时,恢复其他工作线程运行。这也是JVM运行中最头疼的问题。

分代堆内存GC策略

上述垃圾回收算法都有优缺点,能不能对不同数据进行区分管理,不同分区对数据实施不同回收策略,分而治之。

堆内存分代

将heap内存空间分为三个不同类别: 年轻代、老年代、持久代

Heap堆内存分为:
    年轻代Young:Young Generation
    伊甸园区eden: 只有一个,刚刚创建的对象
    幸存(存活)区Servivor Space:有2个幸存区,一个是from区,一个是to区。大小相等、地位
相同、可互换。
        from 指的是本次复制数据的源区
        to 指的是本次复制数据的目标区
    老年代Tenured:Old Generation, 长时间存活的对象
    
    永久代:JDK1.7之前使用, 即Method Area方法区,保存JVM自身的类和方法,存储JAVA运行时的环境信息,JDK1.8后 改名为 MetaSpace,此空间不存在垃圾回收,关闭JVM会释放此区域内存,此空间物理上不属于heap内存,但逻辑上存在于heap内存
        永久代必须指定大小限制,字符串常量JDK1.7存放在永久代,1.8后存放在heap中
        MetaSpace 可以设置,也可不设置,无上限

规律: 一般情况99%的对象都是临时对象

年轻代回收 Minor GC

  1. 起始时,所有新建对象(特大对象直接进入老年代)都出生在eden,当eden满了,启动GC。这个称
    为Young GC 或者 Minor GC。
  2. 先标记eden存活对象,然后将存活对象复制到s0(假设本次是s0,也可以是s1,它们可以调
    换),eden剩余所有空间都清空。GC完成。
  3. 继续新建对象,当eden再次满了,启动GC。
  4. 先同时标记eden和s0中存活对象,然后将存活对象复制到s1。将eden和s0清空,此次GC完成
  5. 继续新建对象,当eden满了,启动GC。
  6. 先标记eden和s1中存活对象,然后将存活对象复制到s0。将eden和s1清空,此次GC完成

以后就重复上面的步骤。
通常场景下,大多数对象都不会存活很久,而且创建活动非常多,新生代就需要频繁垃圾回收。
但是,如果一个对象一直存活,它最后就在from、to来回复制,如果from区中对象复制次数达到阈值
(默认15次,CMS为6次,可通过java的选项 -XX:MaxTenuringThreshold=N 指定),就直接复制到老年代。

老年代回收 Major GC

进入老年代的数据较少,所以老年代区被占满的速度较慢,所以垃圾回收也不频繁。

如果老年代也满了,会触发老年代GC,称为Old GC或者 Major GC。

由于老年代对象一般来说存活次数较长,所以较常采用标记-压缩算法。
当老年代满时,会触发 Full GC,即对所有"代"的内存进行垃圾回收

Minor GC比较频繁,Major GC较少。但一般Major GC时,由于老年代对象也可以引用新生代对象,所以先进行一次Minor GC,然后在Major GC会提高效率。可以认为回收老年代的时候完成了一次FullGC。
所以可以认为 MajorGC = FullGC

Minor GC 触发条件:当eden区满了触发

Full GC 触发条件:
    老年代满了
    System.gc()手动调用。不推荐
    
年轻代:
    存活时长低
    适合复制算法
    
老年代:
    区域大,存活时长高
    适合标记压缩算法

java 内存调整相关参数

JVM 内存常用相关参数

Java 命令行参考文档: https://docs.oracle.com/javase/8/docs/technotes/tools/unix/java.html

帮助:man java

选项分类

-选项名称 此为标准选项,所有HotSpot都支持
-X选项名称 此为稳定的非标准选项
-XX:选项名称 非标准的不稳定选项,下一个版本可能会取消
参数 说明 举例
-Xms 设置应用程序初始使用的堆内存大小(年轻代+老年代) -Xms2g
-Xmx 设置应用程序能获得的最大堆内存早期JVM不建议超过32G,内存管理效率下降 -Xms4g
-XX:NewSize 设置初始新生代大小 -XX:NewSize=128m
-XX:MaxNewSize 设置最大新生代内存空间 -XX:MaxNewSize=256m
-Xmnsize 同时设置-XX:NewSize 和 -XX:MaxNewSize,代替两者 -Xmn1g
-XX:NewRatio 以比例方式设置新生代和老年代 -XX:NewRatio=2,new/old=1/2
-XX:SurvivorRatio 以比例方式设置eden和survivor(S0或S1) -XX:SurvivorRatio=6,eden/survivor=6/1,new/survivor=8/1
-Xss 设置每个线程私有的栈空间大小,依据具体线程大小和数量 -Xss256k
范例: 查看java的选项帮助
#查看java命令标准选项
[root@centos ~]# java
...
#查看java的非标准选项
[root@centos8 ~]# java -X
-Xmixed mixed mode execution (default)
...
#查看所有不稳定选项的当前生效值
[root@centos8 ~]# java -XX:+PrintFlagsFinal
[Global flags]
intx ActiveProcessorCount = -1
...
#查看所有不稳定选项的默认值
[root@centos8 ~]# java -XX:+PrintFlagsInitial
[Global flags]
intx ActiveProcessorCount = -1
...
#查看当前命令行的使用的选项设置
[root@centos8 ~]# java -XX:+PrintCommandLineFlags -XX:InitialHeapSize=15598528 -XX:MaxHeapSize=249576448 -
XX:+PrintCommandLineFlags -XX:+UseCompressedClassPointers -XX:+UseCompressedOops -XX:+UseParallelGC
#上面的-XX:+UseParallelGC 说明当前使用Parallel Scavenge + Parallel Old

范例: 查看和指定JVM内存分配

#默认JVM试图分配最大内存的总内存的1/4,初始化默认总内存为总内存的1/64

#编译生成class文件
[root@centos8 ~]# javac Heap.java

#通过$CLASSPATH指定类文件路径,否则无法找到类,也可以通过 java -cp /path指定类路径
[root@centos8 ~]# echo $CLASSPATH
/usr/local/jdk/lib/:/usr/local/jdk/jre/lib/

[root@centos8 ~]# cp Heap.class /usr/local/jdk/lib
#查看当前内存默认值
[root@centos8 ~]# java -XX:+PrintGCDetails Heap

#指定内存空间
[root@centos8 ~]# java -Xms1024m -Xmx1024m -XX:+PrintGCDetails Heap

范例: 查看OOM

JDK 工具监控使用情况

案例1: jvisualvm工具
范例: 指定参数运行Java程序

[root@centos8 ~]# java -cp . -Xms512m -Xmx1g HelloWorld

[root@tomcat ~]# java -Xms256m -Xmx512m HelloWorld
[root@tomcat ~]# java -Xms128m -Xmx512m -XX:NewSize=64m -XX:MaxNewSize=200m
HelloWorld
hello magedu
[root@tomcat ~]# jps
21299 Main
21418 Jps
21407 HelloWorld

#将Linux的图形工具显示到windows桌面
#方法1
#注意:先在windows上开启Xwindows Server,如Xmanager
[root@tomcat ~]# export DISPLAY=172.31.0.1:0.0

#方法2:使用 MobaXterm 连接
[root@tomcat ~]# yum -y install xorg-x11-xauth xorg-x11-fonts-* xorg-x11-fontutils xorg-x11-fonts-Type1
[root@tomcat ~]# exit

#运行图形工具
[roottomcat ~]# which jvisualvm
/usr/local/jdk/bin/jvisualvm
[root@tomcat ~]# jvisualvm

案例2: 使用 jvisualvm的 Visual GC 插件

范例: 使用 jvisualvm的 Visual GC 插件 观察 java程序的OOM

Jprofiler定位OOM的问题原因

JProfiler是一款功能强大的Java开发分析工具,它可以快速的帮助用户分析出存在的错误,软件还可对需
要的显示类进行标记,包括了内存的分配情况和信息的视图等

JProfiler官网:http://www.ej-technologies.com/products/jprofiler/overview.html

下载并安装JProfiler(傻瓜式安装略)后,双击打开前面生成的两个文件java_pid96236.hprof和java_pid96339,可以看到显示,从中分析OOM原因

Tomcat的JVM参数设置

默认不指定,-Xmx大约使用了1/4的内存,当前本机内存指定约为1G。
在bin/catalina.sh中增加一行

......
# OS specific support. $var _must_ be set to either true or false.
#添加下面一行
JAVA_OPTS="-server -Xms128m -Xmx512m -XX:NewSize=48m -XX:MaxNewSize=200m"
cygwin=false
darwin=false
........

-server:VM运行在server模式,为在服务器端最大化程序运行速度而优化
-client:VM运行在Client模式,为客户端环境减少启动时间而优化

重启 Tomcat 观察

垃圾收集方式

按工作模式不同:指的是GC线程和工作线程是否一起运行

    独占垃圾回收器:只有GC在工作,STW一直进行到回收完毕,工作线程才能继续执行

    并发垃圾回收器:让GC线程垃圾回收某些阶段可以和工作线程一起进行,如:标记阶段并行,回收阶段仍然串行

按回收线程数:指的是GC线程是否串行或并行执行

    串行垃圾回收器:一个GC线程完成回收工作

    并行垃圾回收器:多个GC线程同时一起完成回收工作,充分利用CPU资源

调整策略

对JVM调整策略应用极广
在WEB领域中Tomcat等
在大数据领域Hadoop生态各组件
在消息中间件领域的Kafka等
在搜索引擎领域的ElasticSearch、Solr等

注意: 在不同领域和场景对JVM需要不同的调整策略

减少 STW 时长,串行变并行

减少 GC 次数,要分配合适的内存大小

一般情况下,大概可以使用以下原则:

客户端或较小程序,内存使用量不大,可以使用串行回收
对于服务端大型计算,可以使用并行回收
大型WEB应用,用户端不愿意等待,尽量少的STW,可以使用并发回收

垃圾回收器

常用垃圾回收器

按分代设置不同垃圾回收器:

新生代

新生代串行收集器Serial:单线程、独占式串行,采用复制算法,简单高效但会造成STW

新生代并行回收收集器PS(Parallel Scavenge):多线程并行、独占式,会产生STW, 使用复制算法
关注调整吞吐量,此收集器关注点是达到一个可控制的吞吐量
吞吐量 = 运行用户代码时间/(运行用户代码时间+垃圾收集时间),比如虚拟机总共运行100分钟,其中垃圾回收花掉1分钟,那吞吐量就是99%。高吞吐量可以高效率利用CPU时间,尽快完成运算任务,主要适合在后台运算而不需要太多交互的任务。
除此之外,Parallel Scavenge 收集器具有自适应调节策略,它可以将内存管理的调优任务交给虚
拟机去完成。自适应调节策略也是Parallel Scavenge与 ParNew 收集器的一个重要区别。和ParNew不同,PS不可以和老年代的CMS组合

新生代并行收集器ParNew:就是Serial 收集器的多线程版,将单线程的串行收集器变成了多线程并
行、独占式,使用复制算法,相当于PS的改进版
经常和CMS配合使用,关注点是尽可能地缩短垃圾收集时用户线程的停顿时间,适合需要与用户交互的程序,良好的响应速度能提升用户体验

老年代:

老年代串行收集器Serial Old:Serial Old是Serial收集器的老年代版本,单线程、独占式串行,回收算法使用标记压缩

老年代并行回收收集器Parallel Old:多线程、独占式并行,回收算法使用标记压缩,关注调整吞吐量
Parallel Old收集器是Parallel Scavenge 收集器的老年代版本,这个收集器是JDK1.6之后才开始提
供,从HotSpot虚拟机的垃圾收集器的图中也可以看出,Parallel Scavenge 收集器无法与CMS收集
器配合工作,因为一个是为了吞吐量,一个是为了客户体验(也就是暂停时间的缩短)
CMS (Concurrent Mark Sweep并发标记清除算法) 收集器
    在某些阶段尽量使用和工作线程一起运行,减少STW时长(200ms以内), 提升响应速度,是互联网服务端BS系统上较佳的回收算法
    
    分为4个阶段:初始标记、并发标记、重新标记、并发清除,在初始标记、重新标记时需要STW。

    初始标记:此过程需要STW(Stop The Word),只标记一下GC Roots能直接关联到的对象,速度很快。
    
    并发标记:就是GCRoots进行扫描可达链的过程,为了找出哪些对象需要收集。这个过程远远慢于初始标记,但它是和用户线程一起运行的,不会出现STW,所有用户并不会感受到。
    
    重新标记:为了修正在并发标记期间,用户线程产生的垃圾,这个过程会比初始标记时间稍微长一点,但是也很快,和初始标记一样会产生STW。
    
    并发清理:在重新标记之后,对现有的垃圾进行清理,和并发标记一样也是和用户线程一起运行的,耗时较长(和初始标记比的话),不会出现STW。
    
由于整个过程中,耗时最长的并发标记和并发清理都是与用户线程一起执行的,所以总体上来说,CMS收集器的内存回收过程是与用户线程一起并发执行的。

以下收集器不再按明确的分代单独设置

G1(Garbage First)收集器
    是最新垃圾回收器,从JDK1.6实验性提供,JDK1.7发布,其设计目标是在多处理器、大内存服务器端提供优于CMS收集器的吞吐量和停顿控制的回收器。JDK9将G1设为默认的收集器,建议 JDK9版本以后使用。
    
    基于标记压缩算法,不会产生大量的空间碎片,有利于程序的长期执行。
    
    分为4个阶段:初始标记、并发标记、最终标记、筛选回收。并发标记并发执行,其它阶段STW只有GC线程并行执行。
    
    G1收集器是面向服务端的收集器,它的思想就是首先回收尽可能多的垃圾(这也是Garbage-First名字的由来)
    
    G1能充分的利用多CPU,多核环境下的硬件优势,使用多个CPU来缩短STW停顿的时间(10ms以内)。
    
    可预测的停顿:这是G1相对于CMS的另一大优势,G1和CMS一样都是关注于降低停顿时间,但是G1能够让使用者明确的指定在一个M毫秒的时间片段内,消耗在垃圾收集的时间不得超过N毫秒。
    
    通过此选项指定: +UseG1GC
    
ZGC收集器: 减少SWT时长(1ms以内), 可以PKC++的效率,目前实验阶段

Shenandoah收集器: 和ZGC竞争关系,目前实验阶段

Epsilon收集器: 调试 JDK 使用,内部使用,不用于生产环境

JVM 1.8 默认的垃圾回收器:PS + ParallelOld,所以大多数都是针对此进行调优

垃圾收集器设置

优化调整Java 相关参数的目标: 尽量减少FullGC和STW,
通过以下选项可以单独指定新生代、老年代的垃圾收集器

-server 指定为Server模式,也是默认值,一般使用此工作模式
-XX:+UseSerialGC
    运行在Client模式下,新生代是Serial, 老年代使用SerialOld
-XX:+UseParNewGC
    新生代使用ParNew,老年代使用SerialOld
-XX:+UseParallelGC
    运行于server模式下,新生代使用Serial Scavenge,老年代使用SerialOld
-XX:+UseParallelOldGC
    新生代使用Paralell Scavenge, 老年代使用Paralell Old
    
    -XX:ParallelGCThreads=N,在关注吞吐量的场景使用此选项增加并行线程数
-XX:+UseConcMarkSweepGC
    新生代使用ParNew, 老年代优先使用CMS,备选方式为Serial Old
    
    响应时间要短,停顿短使用这个垃圾收集器
    
    -XX:CMSInitiatingOccupancyFraction=N,N为0-100整数表示达到老年代的大小的百分比多少触发回收,默认68
    
    -XX:+UseCMSCompactAtFullCollection开启此值,在CMS收集后,进行内存碎片整理
    -XX:CMSFullGCsBeforeCompaction=N设定多少次CMS后,进行一次内存碎片整理
    -XX:+CMSParallelRemarkEnabled 降低标记停顿

范例:

-XX:+UseConcMarkSweepGC -XX:CMSInitiatingOccupancyFraction=80 -XX:+UseCMSCompactAtFullCollection -XX:CMSFullGCsBeforeCompaction=5

范例: 查看默认模式

[root@centos8 ~]# java | & grep '-server'
-server to select the "server" VM
The default VM is server.

[root@centos8 ~]# tail -n 2 /usr/local/jdk/jre/lib/amd64/jvm.cfg
-server KNOWN
-client IGNORE

范例: 指定垃圾回收设置

#将参数加入到bin/catalina.sh中,重启观察Tomcat status。老年代已经使用CMS
[root@tomcat ~]# vim /usr/local/tomcat/bin/catalina.sh
......
# OS specific support. $var _must_ be set to either true or false.
JAVA_OPTS="-server -Xmx512m -Xms128m -XX:NewSize=48m -XX:MaxNewSize=200m -XX:+UseConcMarkSweepGC -XX:+UseCMSCompactAtFullCollection -XX:CMSFullGCsBeforeCompaction=5"
cygwin=false
darwin=false
os400=false
.......
[root@tomcat ~]# systemctl restart tomcat

开启垃圾回收输出统计信息,适用于调试环境的相关选项

-XX:+PrintGC 输出GC信息
-XX:+PrintGCDetails 输出GC详细信息
-XX:+PrintGCTimeStamps 与前两个组合使用,在信息上加上一个时间戳
-XX:+PrintHeapAtGC 生成GC前后椎栈的详细信息,日志会更大

注意: 以上适用调试环境,生产环境请移除这些参数,否则有非常多的日志输出

JAVA参数总结

参数 名称含义 默认值 xx
-Xms 初始堆大小 物理内存的1/64(<1GB) 默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时,JVM就会增大堆直到-Xmx的最大限制.
-Xmx 最大堆大小 物理内存的1/4(<1GB) 默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时,JVM会减少堆直到-Xms的最小限制
-Xmn 年轻代大小(1.4or lator) 注意:此处的大小是(eden+ 2 survivor space).与jmap -heap中显示的Newgen是不同的。整个堆大小=年轻代大小 +年老代大小 +持久代大小. 增大年轻代后,将会减小年老代大小.此值对系统性能影响较大,Sun官方推荐配置为整个堆的3/8
-XX:NewSize 设置年轻代大小(for 1.3/1.4)
-XX:MaxNewSize 年轻代最大值(for 1.3/1.4)
-XX:PermSize 设置持久代(perm gen)初始值 物理内存的1/64
-XX:MaxPermSize 设置持久代最大值 物理内存的1/4
-Xss 每个线程的堆栈大小 JDK5.0以后每个线程堆栈大小为1M,以前每个线程堆栈大小为256K.更具应用的线程所需内存大小进行 调整.在相同物理内存下,减小这个值能生成更多的线程.但是操作系统对一个进程内的线程数还是有限制的,不能无限生成,经验值在3000~5000左右 一般小的应用, 如果栈不是很深, 应该是128k够用的大的应用建议使用256k。这个选项对性能影响比较大,需要严格的测试。
参数 名称含义 默认值 xxx
-XX:ThreadStackSize Thread Stack Size (0 means use default stacksize) [Sparc: 512; Solarisx86: 320 (was 256 prior in 5.0 and earlier); Sparc 64bit: 1024; Linux amd64:1024 (was 0 in 5.0 andearlier); all others 0.]
-XX:NewRatio 年轻代(包括Eden和两个Survivor区)与年老代的比值(除去持久代) -XX:NewRatio=4表示年轻代与年老代所占比值为1:4,年轻代占整个堆栈的1/5Xms=Xmx并且设置了Xmn的情况下,该参数不需要进行设置。
-XX:SurvivorRatio Eden区与Survivor区的大小比值 设置为8,则两个Survivor区与一个Eden区的比值为2:8,一个Survivor区占整个年轻代的1/10
-XX:LargePageSizeInBytes 内存页的大小不可设置过大, 会影响
Perm的大小 =128m
XX:+UseFastAccessorMethods 原始类型的快速优化
-XX:+DisableExplicitGC 关闭System.gc() 这个参数需要严格的测试
-XX:MaxTenuringThreshold 垃圾最大年龄 如果设置为0的话,则年轻代对象不经过Survivor区,直接进入年老代. 对于年老代比较多的应用,可以提高效率.如果将此值设置为一个较大值,则年轻代对象会在Survivor区进行多次复制,这样可以增加对象再年轻代的存活 时间,增加在年轻代即被回收的概率该参数只有在串行GC时才有效
-XX:+AggressiveOpts 加快编译
-XX:+UseBiasedLocking 锁机制的性能改善
-Xnoclassgc 禁用垃圾回收
-XX:SoftRefLRUPolicyMSPerMB 每兆堆空闲空间中SoftReference的存活时间 可达的对象在上次被引用后将保留一段时间。 缺省值是堆中每个空闲兆字节的生命周期的一秒钟
参数 名称含义 默认值 xxx
-XX:PretenureSizeThreshold 对象超过多大是直接在旧生代分配 0 单位字节 新生代采用Parallel Scavenge GC时无效另一种直接在旧生代分配的情况是大的数组对象,且数组中无外部引用对象.
-XX:TLABWasteTargetPercent TLAB占eden区的百分比 1%
-XX:+CollectGen0First FullGC时是否先YGC false

并行收集器相关参数

-XX:+UseParallelGC Full GC采用parallel MSC 选择垃圾收集器为并行收集器.此配置仅对年轻代有效.即上述配置下,年轻代使用并发收集,而年老代仍旧使用串行收集
-XX:+UseParNewGC 设置年轻代为并行收集 可与CMS收集同时使用 JDK5.0以上,JVM会根据系统配置自行设置,所以无需再设置此值
-XX:ParallelGCThreads 并行收集器的线程数 此值最好配置与处理器数目相等 同样适用于CMS
-XX:+UseParallelOldGC 年老代垃圾收集方式为并行收集(ParallelCompacting) 这个是JAVA 6出现的参数选项
-XX:MaxGCPauseMillis 每次年轻代垃圾回收的最长时间(最大暂停时间) 如果无法满足此时间,JVM会自动调整年轻代大小,以满足此值.
-XX:+UseAdaptiveSizePolicy 自动选择年轻代区大小和相应的Survivor区比例 设置此选项后,并行收集器会自动选择年轻代区大小和相应的Survivor区比例,以达到目标系统规定的最低相应时间或者收集频率等,此值建议使用并行收集器时,一直打开.
-XX:GCTimeRatio 设置垃圾回收时间占程序运行时间的百分比 公式为1/(1+n)
-XX:+ScavengeBeforeFullGC Full GC前调用YGC true

CMS相关参数

-XX:+UseConcMarkSweepGC 使用CMS内存收集 测试中配置这个以后,-XX:NewRatio=4的配置可能失效,所以,此时年轻代大小最好用-Xmn设置
-XX:+AggressiveHeap 试图是使用大量的物理内存 长时间大内存使用的优化,能检查计算资源(内存, 处理器数量) 至少需要256MB内存 大量的CPU/内存, (在1.4.1在4CPU的机器上已经显示有提升)
-XX:CMSFullGCsBeforeCompaction 多少次后进行内存压缩 由于并发收集器不对内存空间进行压缩,整理,所以运行一段时间以后会产生"碎片",使得运行效率降低.此值设置运行多少次GC以后对内存空间进行压缩,整理.
-XX:+CMSParallelRemarkEnabled 降低标记停顿
-XX+UseCMSCompactAtFullCollection 在FULLGC的时候,对年老代的压缩 CMS是不会移动内存的, 因此, 这个非常容易产生碎片,导致内存不够用, 因此, 内存的压缩这个时候就会被启用。增加这个参数是个好习惯。 可能会影响性能,但是可以消除碎片
-XX:+UseCMSInitiatingOccupancyOnly 使用手动定义初始化定义开始CMS收集 禁止hostspot自行触发CMS GC
-XX:CMSInitiatingOccupancyFraction=70 使用cms作为垃圾回收使用70%后开始CMS收集 92
-XX:+UseConcMarkSweepGC 使用CMS内存收集 测试中配置这个以后,-XX:NewRatio=4的配置可能失效,所以,此时年轻代大小最好用-Xmn设置
-XX:CMSInitiatingPermOccupancyFraction 设置PermGen使用到达多少比率时触发 92
-XX:+CMSIncrementalMode 设置为增量模式 用于单CPU情况
-XX:+CMSClassUnloadingEnabled

辅助信息

-XX:+PrintGC header 2 xx 输出形式:[GC 118250K->113543K(130112K),0.0094143 secs] [Full GC121376K->10414K(130112K),0.0650971 secs]
-XX:+PrintGCDetails 输出形式:[GC [DefNew:8614K->781K(9088K),0.0123035 secs] 118250K->113543K(130112K),0.0124633 secs] [GC[DefNew: 8614K->8614K(9088K), 0.0000665secs] 121376K->10414K(130112K),0.0436268 secs]
-XX:+PrintGCTimeStamps
-XX:+PrintGC:PrintGCTimeStamps 可与-XX:+PrintGC -XX:+PrintGCDetails混合使用输出形式:11.851: [GC98328K->93620K(130112K),0.0082960 secs]
-XX:+PrintGCApplicationStoppedTime 打印垃圾回收期间程序暂停的时间.可与上面混合使用 输出形式:Total time forwhich application threadswere stopped: 0.0468229seconds
XX:+PrintGCApplicationConcurrentTime 打印每次垃圾回收前,程序未中断的执行时间.可与上面混合使用 输出形式:Application time:0.5291524 seconds
-XX:+PrintHeapAtGC 打印GC前后的详细堆栈信息
-Xloggc:filename 把相关日志信息记录到文件以便分析. 与上面几个配合使用
-XX:+PrintGC 输出形式:[GC 118250K->113543K(130112K),0.0094143 secs] [Full GC121376K->10414K(130112K),0.0650971 secs]
-XX:+PrintClassHistogram garbagecollectsbeforeprintingthehistogram.
-XX:+PrintTLAB 查看TLAB空间的使用情况
XX:+PrintTenuringDistribution 查看每次minor GC后新的存活周期的阈值

JVM相关工具

JVM 工具概述

$JAVA_HOME/bin下

命令 说明
jps 查看所有jvm进程
jinfo 查看进程的运行环境参数,主要是jvm命令行参数
jstat 对jvm应用程序的资源和性能进行实时监控
jstack 查看所有线程的运行状态
jmap 查看jvm占用物理内存的状态
jhat +UseParNew
jconsole 图形工具
jvisualvm 图形工具

jps

JVM 进程状态工具

格式

jps:Java virutal machine Process Status tool,
jps [-q] [-mlvV] [<hostid>]
-q:静默模式;
-v:显示传递给jvm的命令行参数;
-m:输出传入main方法的参数;
-l:输出main类或jar完全限定名称;
-v:显示通过flag文件传递给jvm的参数;
[<hostid>]:主机id,默认为localhost;

范例

#显示java进程
[root@tomcat ~]# jps
22357 Jps
21560 Main
21407 HelloWorld
#详细列出当前Java进程信息
[root@tomcat ~]# jps -l -v

jinfo

输出给定的java进程的所有配置信息
格式:

jinfo [option] <pid>
-flags:打印 VM flags
-sysprops:to print Java system properties
-flag <name>:to print the value of the named VM flag

范例:

#先获得一个java进程ID,然后jinfo
[root@tomcat ~]# jps
22357 Jps
21560 Main
21407 HelloWorld
[root@tomcat ~]# jinfo 21407
Attaching to process ID 21407, please wait...

jstat

输出指定的java进程的统计信息
格式:

jstat -help|-options
jstat -<option> [-t] [-h<lines>] <vmid> [<interval> [<count>]]
[<interval> [<count>]]
interval:时间间隔,单位是毫秒;
count:显示的次数;
#返回可用统计项列表
# jstat -options
-class:class loader
-compiler:JIT
-gc:gc
-gccapacity:统计堆中各代的容量
-gccause:
-gcmetacapacity
-gcnew:新生代
-gcnewcapacity
-gcold:老年代
-gcoldcapacity
-gcutil

范例:

[root@tomcat ~]# jstat -gc 21407

S0C:S0区容量
YGC:新生代的垃圾回收次数
YGCT:新生代垃圾回收消耗的时长;
FGC:Full GC的次数
FGCT:Full GC消耗的时长
GCT:GC消耗的总时长
#3次,一秒一次
[root@tomcat ~]# jstat -gcnew 21407 1000 3
S0C S1C S0U S1U TT MTT DSS EC EU YGC YGCT
8704.0 8704.0 1563.6 0.0 15 15 4352.0 69952.0 62794.3 2 0.050
8704.0 8704.0 1563.6 0.0 15 15 4352.0 69952.0 62794.3 2 0.050
8704.0 8704.0 1563.6 0.0 15 15 4352.0 69952.0 63074.5 2 0.050

jstack

程序员常用堆栈情况查看工具

jstack:查看指定的java进程的线程栈的相关信息
格式:

jstack [-l] <pid>
jstack -F [-m] [-l] <pid>
-l:long listings,会显示额外的锁信息,因此,发生死锁时常用此选项
-m:混合模式,既输出java堆栈信息,也输出C/C++堆栈信息
-F:当使用"jstack -l PID"无响应,可以使用-F强制输出信息

范例:

#先获得一个java进程PID,然后jinfo
[root@tomcat ~]# jstack -l 21407

jmap

Memory Map, 用于查看堆内存的使用状态

#查看进程堆内存情况
[root@tomcat ~]# jmap -heap 21407
Attaching to process ID 21407, please wait...

jhat

Java Heap Analysis Tool 堆分析工具
格式

jmap [option] <pid>
#查看堆空间的详细信息:
jmap -heap <pid>

范例:

[root@t1 ~]# jmap -heap 96334
Attaching to process ID 96334, please wait...

#查看堆内存中的对象的数目:
jmap -histo[:live] <pid>
live:只统计活动对象;
#保存堆内存数据至文件中,而后使用jvisualvm或jhat进行查看:
jmap -dump:<dump-options> <pid>
dump-options:
live dump only live objects; if not specified, all objects in the heap are
dumped.
format=b binary format
file=<file> dump heap to <file>

jconsole

图形化工具,可以用来查看Java进程信息
JMX(Java Management Extensions,即Java管理扩展)是一个为JAVA应用程序、设备、系统等植入管
理功能的框架。JMX可以跨越一系列异构操作系统平台、系统体系结构和网络传输协议,灵活的开发无
缝集成的系统、网络和服务管理应用。
JMX最常见的场景是监控Java程序的基本信息和运行情况,任何Java程序都可以开启JMX,然后使用
JConsole或Visual VM进行预览。

#为Java程序开启JMX很简单,只要在运行Java程序的命令后面指定如下命令即可
-Djava.rmi.server.hostname=172.31.0.100 #指定自已监听的IP
-Dcom.sun.management.jmxremote.port=1000 #指定监听的PORT
-Dcom.sun.management.jmxremote.ssl=false
-Dcom.sun.management.jmxremote.authenticate=false

在 tomcat 开启远程 JMX 支持 Zabbix 监控,如下配置

[root@tomcat ~]# vim /usr/local/tomcat/bin/catalina.sh
CATALINA_OPTS="$CATALINA__OPTS
-Dcom.sun.management.jmxremote #启用远程监控JMX
-Dcom.sun.management.jmxremote.port=XXXXX #默认启动的JMX端口号,要和
zabbix添加主机时候的端口一致即可
-Dcom.sun.management.jmxremote.authenticate=false #不使用用户名密码
-Dcom.sun.management.jmxremote.ss1=false #不使用ssl认证
-Djava.rmi.server.hostname=<JAVA主机IP>" #tomcat主机自己的IP地址,不要写zabbix服务器的地址

使用Jconsle通过JMX查看Java程序的运行信息

范例: 开启远程JMX功能

[root@tomcat ~]# vim /usr/local/tomcat/bin/catalina.sh
CATALINA_OPTS="$CATALINA__OPTS -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.port=12345 -Dcom.sun.management.jmxremote.authenticate=false -Dcom.sun.management.jmxremote.ssl=false -Djava.rmi.server.hostname=172.31.0.101"
# OS specific support. $var _must_ be set to either true or false.
.......
[root@tomcat ~]# systemctl restart tomcat

Tomcat 性能优化常用配置

内存空间优化

JAVA_OPTS="-server -Xms4g -Xmx4g -XX:NewSize= -XX:MaxNewSize= "
-server:服务器模式
-Xms:堆内存初始化大小
-Xmx:堆内存空间上限
-XX:NewSize=:新生代空间初始化大小
-XX:MaxNewSize=:新生代空间最大值

生产案例:

[root@centos8 ~]# vim /usr/local/tomcat/bin/catalina.sh
JAVA_OPTS="-server -Xms4g -Xmx4g -Xss512k -Xmn1g -XX:CMSInitiatingOccupancyFraction=65 -XX:+AggressiveOpts -XX:+UseBiasedLocking -XX:+DisableExplicitGC -XX:MaxTenuringThreshold=10 -XX:NewRatio=2 -XX:PermSize=128m -XX:MaxPermSize=512m -XX:CMSFullGCsBeforeCompaction=5 -XX:+ExplicitGCInvokesConcurrent -XX:+UseConcMarkSweepGC -XX:+UseParNewGC -XX:+CMSParallelRemarkEnabled -XX:+UseCMSCompactAtFullCollection -XX:LargePageSizeInBytes=128m -XX:+UseFastAccessorMethods"
#一台tomcat服务器并发连接数不高,生产建议分配物理内存通常4G到8G较多,如果需要更多连接,一般会利用虚拟化技术实现多台tomcat

线程池调整

[root@centos8 ~]# vim /usr/local/tomcat/conf/server.xml
......
<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000"
redirectPort="8443" />
......

常用属性:

connectionTimeout :连接超时时长,单位ms
maxThreads:最大线程数,默认200
minSpareThreads:最小空闲线程数
maxSpareThreads:最大空闲线程数
acceptCount:当启动线程满了之后,等待队列的最大长度,默认100
URIEncoding:URI 地址编码格式,建议使用 UTF-8
enableLookups:是否启用客户端主机名的DNS反向解析,缺省禁用,建议禁用,就使用客户端IP就行

compression:是否启用传输压缩机制,建议 "on",CPU和流量的平衡
    compressionMinSize:启用压缩传输的数据流最小值,单位是字节
    compressableMimeType:定义启用压缩功能的MIME类型text/html, text/xml, text/css,text/javascript

Java压力测试工具

PerfMa 致力于打造一站式IT系统稳定性保障解决方案,专注于性能评测与调优、故障根因定位与解决,
为企业提供一系列技术产品与专家服务,提升系统研发与运行质量。

#社区产品
https://opts.console.perfma.com/
posted @ 2021-08-20 21:10  空白的旋律  阅读(300)  评论(0编辑  收藏  举报