磁盘IO 导致线程阻塞

项目有一段时间,不常用的应用响应变慢,每次持续几秒钟到几十秒钟就自动恢复。如果响应变慢是持续的还好办,直接用 jstack 抓线程堆栈,基本可以很快定位问题。关键持续时间只有最多几十秒钟,而且是偶发的,一天只发生一两次,有时几天才发生一次,发生时间点也不确定,人盯着然后用 jstack手工抓线程堆栈显然不现实。

好吧,既然手工的办法不现实,咱们就来自动的,写一个 shell脚本自动定时执行 jstack,5秒执行一次 jstack,每次执行结果放到不同日志文件中,只保存10000个日志文件。Shell脚本如下:

 1 #!/bin/bash
 2 num=0
 3 log="/tmp/jstack_thread_log/thread_info"
 4 
 5 cd /tmp
 6 if [ ! -d "jstack_thread_log" ]; then
 7    mkdir jstack_thread_log
 8 fi
 9 
10 while ((num <= 10000));
11 
12   do
13 
14     ID=`ps -ef | grep java | grep gaea | grep -v "grep" | awk '{print $2}'`
15 
16     if [ -n "$ID" ]; then
17   jstack $ID >> ${log}  
18     fi
19 
20     num=$(( $num + 1 ))
21     mod=$(( $num%100 ))
22 
23     if [ $mod -eq 0 ]; then
24   back=$log$num
25   mv $log $back
26     fi
27     
28     sleep 5
29 
30 done

下一次响应变慢的时候,我们找到对应时间点的 jstack日志文件,发现里面有很多线程阻塞在 logback输出日志的过程,后来我们精简了log,并且把 log输出改成异步,问题解决了,这个脚本果真好用!建议大家保留,以后遇到类似问题时,可以拿来用!

posted @ 2020-11-15 00:09  Java程序员进阶  阅读(32)  评论(0编辑  收藏  举报