java线上内存溢出问题排查步骤

一般线上遇到比较头疼的就是OOM内存溢出问题，我们都会先看错误日志，如果错误日志能够定位出哪个类对象导致内存溢出，那么我们只需要针对问题修改bug就好。但是很多时候我们单凭日志无法定位出内存溢出问题，那么我们这时候就需要以下操作来定位问题。

1、top下对当前服务器内存有个大致了解

top后 shift+M俺内存占用由大到小排序，RES是此进程实际占用内存，%MEM是占服务器总内存的49.8。

2、利用ps命令查看服务pid

[root@speedyao java]# ps -aux|grep java

3、利用jstat查看虚拟机gc情况

jstat -gc:util <vmid> [<interval> [<count>]

vmid：虚拟机进程号

interval:采样时间，默认单位是ms

count：采样条数

[root@speedyao java]# jstat -gcutil  17561  1000 10

以上命令代表1秒钟采样1次，总共采样10次。

FULL GC明显大于YOUNG GC次数，并且FULL GC次数很频繁，说明程序有大内存对象，并且一直无法释放。

4、生成dump文件，有两种方式。一种是利用jmap直接生成dump文件；另一种是利用gcore先生成core文件，再根据core文件利用jmap生成dump文件。

（1）先说第一种，这种比较简单，使用这种方案的时候请注意：JVM会将整个heap的信息dump写入到一个文件，heap如果比较大的话，就会导致这个过程比较耗时，并且执行的过程中为了保证dump的信息是可靠的，所以会暂停应用。

[root@speedyao java]# jmap -dump:format=b,file=heap.prof 17561

format=b：表示生成二进制类型的dump文件

file=：后面写的是输出的dump文件路径

17561：jvm进程id

（2）接下来是第二种。这一种在jmap转换core文件的时候比较耗时，并且生成的dump文件用mat打开的时候分析结果不太正确，不太好定位问题。所以我建议使用第一种，虽然会造成服务挂起吧，但是结果总归是正确的。

利用gcore保存服务的内存信息，因为gcore比jmap的dump会快很多，也不对线上服务有大的影响

[root@speedyao java]# gdb -q --pid=17561

generate-core-file：生成内存对象，生成的文件存储在当前位置，文件格式pid.core

detach：断开与进程的连接

quit：退出

利用jmap将gcore文件转换为java的dump文件，这一步执行的比较慢，可以用nohup执行，以防止误点Ctrl+C导致退出。

[root@speedyao java]# jmap -dump:format=b,file=heap.prof /usr/bin/java core.17561

format=b：表示生成二进制类型的dump文件

file=：后面写的是输出的dump文件路径

/usr/bin/java：java命令路径，可以通过命令which java 获取这个路径

core.17561：表示core文件路径

6、利用MAT（eclipse开发的可以下载eclipse插件，idea开发的可以下载单独的MAT压缩包）分析dump文件。当然也可以用jdk自带的jvisualvm.exe来分析dump文件

上图是概要，阴影部分就是大内存对象类，点击选择 “list Object”、“with incoming references”，就出现下图。下图就是这个对象的信息，RunMian 就是map对象所在的类，这样就能快速定位出哪个类中的哪个对象出现了内存异常。

下图Histogram这个tab是堆内存占比从大到小排序。

以上就是内存问题排查的大致步骤。

转载于：https://blog.csdn.net/u010430495/article/details/87283064?utm_medium=distribute.pc_relevant.none-task-blog-OPENSEARCH-1.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-OPENSEARCH-1.control

发表于 2021-01-04 19:21 金色的鱼儿阅读(1711) 评论(0) 收藏举报

刷新页面返回顶部

java线上内存溢出问题排查步骤

公告