JVM致命错误日志(hs_err_pid.log)解读
致命错误出现的时候,JVM生成了hs_err_pid <pid> .log这样的文件,其中经常包含了虚拟机崩溃原因的重要信息。因为经常遇到,在介绍文章里,我选择了一个,并且逐段分析情况包含的内容(文件可以在文章最后下载)。有时情况下文件是创建在工作目录下的(如果没权限创建的话)JVM会尝试把文件写到/ tmp这样的临时目录下面去),当然,文件格式和路径也可以通过参数指定,例如:
1个
|
java - XX :ErrorFile=/var/log/java/java_error%p.log |
这个文件将包括:
- 触发致命错误的操作异常或信号;
- 版本和配置信息;
- 触发致命异常的线程详细信息和线程栈;
- 当前运行的线程列表和它们的状态;
- 堆的总括信息;
- 加载的本地库;
- 命令行参数;
- 环境变量
- 操作系统CPU的详细信息。
首先,看到的是对问题的概要介绍:
1个
|
# SIGSEGV (0xb) at pc=0x03568cf4, pid=16819, tid=3073346448 |
一个非预期的错误被JRE检测到,其中:
- SIGSEGV是信号名称
- 0xb是信号码
- pc = 0x03568cf4指的是程序计数器的值
- pid = 16819是进展号
- tid = 3073346448是线程号
如果你对JVM有了解,应该不会对这些东西陌生。
接下来是JRE和JVM的版本信息:
1个
2
3
|
# JRE version: 6.0_32-b05 # Java VM: Java HotSpot(TM) Server VM (20.7-b02 mixed mode linux-x86 ) |
运行在混合模式下。
然后是问题帧的信息:
1个
2
3
|
# Problematic frame: # C [libgtk-x11-2.0.so.0+0x19fcf4] __float128+0x19fcf4 |
- C:帧类型为本地帧,帧的类型包括:
- C:本地C帧
- j:解释的Java帧
- V:虚拟机帧
- v:虚拟机生成的存根栈帧
- J:其他帧类型,包括编译后的Java帧
- libgtk-x11-2.0.so.0 + 0x19fcf4:和程序计数器(pc)表达的含义相同,但用的是本地的,所以库+替换量的方式。
接下去第一部分是线程信息:
1个
|
Current thread (0x09f30c00): JavaThread "main" [_thread_in_native, id= 16822 , stack(0xb72a8000,0xb72f9000)] |
当前线程的:
- 0x09f30c00:指针
- JavaThread:线程类型,可能的类型包括:
- Java线程
- 虚拟机线程
- 编译器线程
- GCTaskThread
- 看守线程
- 并发MarkSweepThread
- 主要:名字
- _thread_in_native:线程当前状态,状态枚举包括:
- _thread_uninitialized:线程还没有创建,它只在内存原因崩溃的时候才出现
- _thread_new:线程已经被创造,但是还没有启动
- _thread_in_native:线程正在执行本地代码,一般这种情况很可能是本地代码有问题
- _thread_in_vm:线程正在执行虚拟机代码
- _thread_in_Java:线程正在执行解释或编译后的Java代码
- _thread_blocked:线程位于两端状态
- …_trans:以_trans端点,线程正处于要切换到其他状态的中间状态
- id = 16822:线程ID
- 0xb72a8000,0xb72f9000:栈区间
1个
|
siginfo :si_signo = SIGSEGV : si_errno= 0 , si_code= 1 ( SEGV_MAPERR ), si_addr=0x00000010 |
其中si_errno和si_code是Linux下用来鉴别异常的,Windows下是一个ExceptionCode。
1个
2
3
|
EAX =0x00000000, EBX =0x0375dd84, ECX =0x00000000, EDX =0x00000000 ESP =0xb72f0fa0, EBP =0xb72f0fb8, ESI =0x00000000, EDI =0x0a6c1800 EIP =0x03568cf4, EFLAGS =0x00010246, CR2 =0x00000010 |
这是寄存器寄存器。
1个
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
Top of Stack: (sp=0xb72f0fa0) 0xb72f0fa0: 00000000 00402250 0040217f 0375dd84 0xb72f0fb0: 00000000 0a6c1800 b72f0fe8 0356c2c0 0xb72f0fc0: 00000000 0a6c1800 b72f0fe8 003b3e77 0xb72f0fd0: 003e6c8b 0a1a70d0 0a193358 0375dd84 0xb72f0fe0: 0a276418 0a276418 b72f1048 03536c56 0xb72f0ff0: 0acad000 0b3ca978 0000000c 00dd0674 0xb72f1000: 00000003 0a2c7d50 b72f1038 0000330c 0xb72f1010: ffffffff ffffffff 00000001 00000001 Instructions: (pc=0x03568cf4) 0x03568cd4: 89 14 24 89 75 f8 89 d6 89 7d fc 89 c7 e8 7e 1b 0x03568ce4: ea ff 89 34 24 89 87 d4 02 00 00 e8 30 00 ea ff 0x03568cf4: 8b 40 10 89 3c 24 c7 44 24 08 00 00 00 00 89 87 0x03568d04: d0 02 00 00 8b 83 88 24 00 00 89 44 24 04 e8 dd |
栈顶程序计数器旁的操作码,它们可以被反汇编成系统崩溃前执行的指令。
1个
2
3
4
5
6
7
8
9
10
|
Register to memory mapping: EAX=0x00000000 is an unknown value EBX=0x0375dd84: <offset 0x394d84> in /usr/lib/libgtk-x11-2.0.so.0 at 0x033c9000 ECX=0x00000000 is an unknown value EDX=0x00000000 is an unknown value ESP=0xb72f0fa0 is pointing into the stack for thread: 0x09f30c00 EBP=0xb72f0fb8 is pointing into the stack for thread: 0x09f30c00 ESI=0x00000000 is an unknown value EDI=0x0a6c1800 is an unknown value |
寄存器和内存映射信息。
1个
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
Stack: [0xb72a8000,0xb72f9000], sp=0xb72f0fa0, free space=291k Native frames: ( J =compiled Java code, j=interpreted, Vv= VM code, C =native code) C [libgtk-x11- 2 . 0 .so. 0 +0x19fcf4] __float128+0x19fcf4 C [libgtk-x11- 2 . 0 .so. 0 +0x1a32c0] __float128+0xc0 ... ... C [libswt-pi-gtk- 3738 .so+0x33f6a] Java_org_eclipse_swt_internal_gtk_OS__1Call+0xf J org.eclipse.swt.internal.gtk. OS ._Call( III ) I J org.eclipse.swt.internal.gtk. OS .Call( III ) I Java frames: ( J =compiled Java code, j=interpreted, Vv= VM code) J org.eclipse.swt.internal.gtk. OS ._Call( III ) I J org.eclipse.swt.internal.gtk. OS .Call( III ) I j org.eclipse.swt.widgets.Widget.fixedSizeAllocateProc( II ) I + 5 j org.eclipse.swt.widgets.Display.fixedSizeAllocateProc( II ) I + 17 v ~StubRoutines: :call_stub ... ... |
线程栈。包含了地址,栈顶,栈计数器和线程尚未使用的栈信息,由于栈可能非常长,打印的长度有限制,但是至少本地栈和Java栈都打印出来了(很多时候本地栈打印不出来,但是Java栈一般都能打印出来)。从中可以看到,Eclipse的虚拟机崩溃了。
1个
2
3
4
|
Java Threads: ( => current thread ) 0x0b4c1000 JavaThread "Worker-247" [_thread_blocked, id= 25417 , stack(0x741bc000,0x7420d000)] 0x0a300c00 JavaThread "Worker-246" [_thread_blocked, id= 25235 , stack(0x7d30c000,0x7d35d000)] ... ... |
线程信息。一目了然,不解释了。
1个
|
VM state :not at safepoint (normal execution) |
虚拟机状态。包括:
- 不安全点:正常运行状态;
- 在安全点:所有线程都因为虚拟机等待状态而双重,等待一个虚拟机操作完成;
- 同步:一个特殊的虚拟机操作,要求虚拟机内部的其他线程保持等待状态。
1个
|
VM Mutex/Monitor currently owned by a thread: None |
Mutex是虚拟机内部的锁,而Monitor则关联到了Java对象。
1个
2
3
4
5
6
7
8
9
|
Heap PSYoungGen total 149056K , used 125317K [0xa9700000, 0xb41a0000, 0xb41a0000) eden space 123520K , 95 % used [0xa9700000,0xb0ac0de0,0xb0fa0000) from space 25536K , 26 % used [0xb28b0000,0xb2f50748,0xb41a0000) to space 25600K , 0 % used [0xb0fa0000,0xb0fa0000,0xb28a0000) PSOldGen total 261248K , used 239964K [0x941a0000, 0xa40c0000, 0xa9700000) object space 261248K , 91 % used [0x941a0000,0xa2bf7018,0xa40c0000) PSPermGen total 163328K , used 130819K [0x841a0000, 0x8e120000, 0x941a0000) object space 163328K , 80 % used [0x841a0000,0x8c160c40,0x8e120000) |
对JVM有了解的人应该都清楚,不解释了。堆信息。新生代,老生代,永久代。
1个
2
|
Code Cache [0xb4262000, 0xb5ac2000, 0xb7262000) total_blobs= 5795 nmethods= 5534 adapters= 209 free_code_cache= 25103616 largest_free_block= 38336 |
代码缓存(代码缓存)。这是一块用于编译和保存本地代码的内存,注意是本地代码,它和PermGen(永久代)是不一样的,永久带是用来存放Java类定义的。
1个
2
3
4
5
6
|
Dynamic libraries: 00101000-00122000 r-xp 00000000 08:01 3483560 /usr/lib/libjpeg.so.62.0.0 00122000-00123000 rwxp 00020000 08:01 3483560 /usr/lib/libjpeg.so.62.0.0 00125000-00130000 r-xp 00000000 08:01 9093202 /lib/libgcc_s-4.1.2-20080825.so.1 00130000-00131000 rwxp 0000a000 08:01 9093202 /lib/libgcc_s-4.1.2-20080825.so.1 ... ... |
内存映射。这些信息是虚拟机崩溃时的虚拟内存列表区域。在定位崩溃原因的时候,它可以告诉你该类库正在被使用,位置在哪里,还有更多和守护页信息。就以列表中第一条为例说明:
- 00101000-00122000:内存区域
- r-xp:权限,r / w / x / p / s分别表示读/写/执行/私有/共享
- 00000000:文件内的偏移量
- 08:01:文件位置的majorID和minorID
- 3483560:索引子系统号
- /usr/lib/libjpeg.so.62.0.0:文件位置
每一个lib都有两个块虚拟内存区域-代码和数据,它们的权限不同,代码区域是r-xp;数据区域是rwxp。守护页面(保护页面)由权限为–xp和rwxp的一对组成。 。
1个
2
3
4
5
6
7
8
|
VM Arguments: jvm_args: -Dosgi.requiredJavaVersion= 1 . 5 - XX :MaxPermSize=256m -Xms40m -Xmx512m -Dorg.eclipse.swt.browser.XULRunnerPath= '' java_command: /.../eclipse/plugins/org.eclipse.equinox.launcher_1. 2 . 0 .v20110502.jar -os linux -ws gtk -arch x86 -showsplash -launcher /.../eclipse/eclipse -name Eclipse ... Launcher Type: SUN_STANDARD Environment Variables: PATH =... DISPLAY =: 0 . 0 |
虚拟机参数和环境变量。
1个
2
3
4
|
Signal Handlers: SIGSEGV : [libjvm.so+0x726440], sa_mask[ 0 ]=0x7ffbfeff, sa_flags=0x10000004 SIGBUS : [libjvm.so+0x726440], sa_mask[ 0 ]=0x7ffbfeff, sa_flags=0x10000004 ... ... |
对于Linux下的信号机制,请参见Wiki维基,链接。
1个
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
OS:Red Hat Enterprise Linux Client release 5.4 (Tikanga) uname:Linux 2.6.18-164.el5 #1 SMP Tue Aug 18 15:51:54 EDT 2009 i686 libc:glibc 2.5 NPTL 2.5 rlimit: STACK 10240k, CORE 0k, NPROC 65536, NOFILE 1024, AS infinity load average:1.78 1.58 1.54 /proc/meminfo: ... CPU:total 4 (4 cores per cpu, 1 threads per core) family 6 model 42 stepping 7, cmov, cx8, fxsr, mmx, sse, sse2, sse3, ssse3 /proc/cpuinfo: ... Memory: 4k page, physical 3631860k(155144k free), swap 5124724k(5056452k free) |
本文转自:https://www.raychase.net/1459