JVM内存溢出后服务还能运行吗
文章开篇问一个问题吧,一个java程序,如果其中一个线程发生了OOM,那进程中的其他线程还能运行吗?
接下来做实验,看看JVM的六种OOM之后程序还能不能访问。
在这里我用的是一个springboot程序。
/**
* @author :charon
* @date :Created in 2021/5/17 8:30
* @description : 程序启动类
* @version: 1.0
*/
@SpringBootApplication
public class CharonApplication {
public static void main(String[] args) {
SpringApplication.run(CharonApplication.class, args);
}
}
监测服务是否可用(http://localhost:8080/checkHealth 测试服务正常可用):
/**
* @author :charon
* @date :Created in 2021/5/17 8:49
* @description : 测试服务是否可用
* @version: 1.0
*/
@RestController
public class CheckHealthController {
@RequestMapping("/checkHealth")
public String stackOverFlowError(){
System.out.println("调用服务监测接口-----------------------");
return "服务监测接口返回";
}
}
1.StackOverflowError(栈溢出)
栈溢出代表的是:当栈的深度超过虚拟机分配给线程的栈大小时就会出现error。
/**
* @author :charon
* @date :Created in 2021/5/17 8:49
* @description : 测试java.lang.StackOverflowError: null的错误
* @version: 1.0
*/
@RestController
public class StackOverFlowErrorController {
/**
* 递归调用一个方法,使其超过栈的最大深度
*/
@RequestMapping("/stackOverFlowError")
public void stackOverFlowError(){
stackOverFlowError();
}
}
使用浏览器调用栈溢出的接口(localhost:8080/stackOverFlowError),发现后台报了栈溢出的错误。
调用监测程序可用的接口,发现还是可以正常访问。
2.Java heap space(堆内存溢出)
当GC多次的时候新生代和老生代的堆内存几乎用满了,频繁触发Full GC (Ergonomics) ,直到没有内存空间给新生对象了。所以JVM抛出了内存溢出错误!进而导致程序崩溃。
设置虚拟机参数(-Xms10m -Xmx10m -XX:+PrintGCDetails),如果不设置的话,可能会执行很久。
@RestController
public class JavaHeapSpaceController {
/**
* 使用是循环创建对象,是堆内存溢出
*/
@RequestMapping("/javaHeapSpace")
public void javaHeapSpace(){
String str = "hello world";
while (true){
str += new Random().nextInt(1111111111) + new Random().nextInt(222222222);
/**
* intern()方法:
* (1)当常量池中不存在这个字符串的引用,将这个对象的引用加入常量池,返回这个对象的引用。
* (2)当常量池中存在这个字符串的引用,返回这个对象的引用;
*/
str.intern();
}
}
}
调用监测程序可用的接口,发现还是可以正常访问。
3.direct buffer memory
在写IO程序(如Netty)的时候,经常使用ByteBuffer来读取或者写入数据,这是一种基于通道(channel)和缓冲区(Buffer)的IO方式,他可以使用Native函数库直接分配对外内存,然后通过一个存储在java堆里面的DirectByteBuffer对象作为这块内存的引用操作,这样能在在一些场景中显著提高性能,因为避免了再java堆和Native堆中来回复制数据。
ByteBuffer.allocate(capacity) 这种方式是分配jvm堆内存,属于GC管辖的范围,由于需要拷贝所以速度较慢
ByteBuffer.allocateDirect(capacity) 这种方式是分配本地内存,不属于GC的管辖范围,由于不需要内存拷贝,所以速度较快
但是如果不断分配本地内存,堆内存很少使用,那么JVM就不需要执行GC,DirectByteBuffer对象就不会回收,
这时候堆内存充足,但本地内存可能已经使用光了,再次尝试分配本地内存,就会出现OutOfMemoryError
设置JVM参数: -Xms10m -Xmx10m -XX:+PrintGCDetails -XX:MaxDirectMemorySize=5m
@RestController
public class DirectBufferMemoryController {
@RequestMapping("/directBufferMemory")
public void directBufferMemory(){
System.out.println("初始配置的最大本地内存为:"+ (sun.misc.VM.maxDirectMemory()/1024/1024)+"MB");
// 在jvm参数里设置的最大内存为5M,
ByteBuffer buffer = ByteBuffer.allocateDirect(6*1024*1024);
}
}
访问内存溢出的接口(http://localhost:8080/directBufferMemory),报错之后再次访问服务监测接口,发现还是可以继续访问的。
4.GC overhead limit exceeded
GC回收之间过长会抛出这个错,过长的定义是:超过98%的时间用来做垃圾回收并且只回收了不到2%的堆内存,连续多次GC都只回收了不到2%的极端情况下才会抛出,加入不抛出GC overhead limit错误,就会发生下列情况:
- GC清理的这么点内存很快就会再次被填满,形成恶性循环
- CPU使用率一直是100%,而GC没有任何效果
设置JVM参数: -Xms10m -Xmx10m -XX:+PrintGCDetails -XX:MaxDirectMemorySize=5m
@RestController
public class GcOverHeadController {
@RequestMapping("/gcOverHead")
public void gcOverHead(){
int i = 0;
List<String> list = new ArrayList<>();
try{
while(true){
list.add(String.valueOf(++i).intern());
}
}catch(Throwable e){
System.out.println("i的值为:" + i);
e.printStackTrace();
throw e;
}
}
}
如下图所示,在报错这个异常之前,在频繁的Full GC,但是垃圾回收前后,新生代和老年代的内存差不多,就说明,垃圾回收效果不大。
再次访问服务监测接口,发现还是可以继续访问的。
5.Metaspace
java 8及其以后的版本中使用了MetaSpace代替了永久代,它与永久代最大的区别在于:
MetaSpace并不在虚拟机内存中,而是使用本地内存,也就是说,在java8中,Class metadata被存储在MetaSpace的native Memory中
MetaSpace中存储了一下信息:
- 虚拟机加载的类信息
- 常量池
- 静态变量
- 即时编译后的代码
参数设置:-XX:+PrintGCDetails -XX:MetaspaceSize=50m -XX:MaxMetaspaceSize=50m
@RestController
public class MetaSpaceController {
static class OomTest{
}
/**
* 模拟MetaSpace溢出,不断生成类往元空间放,类占据的空间会超过MetaSpace指定的大小
*/
@RequestMapping("/metaSpace")
public void metaSpace(){
int i = 0;
try{
while (true){
i++;
/**
* Enhancer允许为非接口类型创建一个java代理。Enhancer动态创建了给定类型的子类但是拦截了所有的方法,
* 和proxy不一样的是:不管是接口还是类它都能正常工作。
*/
Enhancer enhancer = new Enhancer();
enhancer.setSuperclass(OomTest.class);
enhancer.setUseCache(false);
enhancer.setCallback(new MethodInterceptor() {
@Override
public Object intercept(Object o, Method method, Object[] objects, MethodProxy methodProxy) throws Throwable {
return methodProxy.invokeSuper(o,objects);
}
});
enhancer.create();
}
}catch (Throwable e){
System.out.println("i的值为:" + i);
e.printStackTrace();
}
}
}
我记得之前看过一篇公众号的文章,就是使用Fastjson创建的代理类导致的Metaspace的问题,具体地址我也忘记了。。。。。
再次访问服务监测接口,发现还是可以继续访问的。
6.unable to create new thread
在高并发服务时,经常会出现如下错误,
导致原因:
- 1.应用程序创建了太多的线程,一个应用进程创建的线程超过了系统承载极限
- 2.服务器不允许应用程序创建这么多线程,linux系统默认允许单个进程可以创建的线程数为1024个(如果是普通用户小于这个值)
解决办法:
- 1.降低应用程序创建线程的数量,分析应用是否真的需要创建这么多线程
- 2.对于有的应用确实需要创建这么多的线程,可以修改linux服务器配置,扩大linux的默认限制
查看:ulimit -u
修改:vim /etc/security/limits.d/90-nproc.conf
@RestController
public class UnableCreateThreadController {
/**
* 友情提示:千万别在windows中运行这段代码,如果不小心和我一样试了,那就只能强制重启了
*/
@RequestMapping("/unableCreateThread")
public void unableCreateThread(){
for (int i = 0; ; i++) {
System.out.println("i的值为:" + i);
new Thread(()->{
try{
Thread.sleep(1000*1000);
} catch (InterruptedException e){
e.printStackTrace();
}
}).start();
}
}
}
我这里是使用的root用户测试的,创建了7409个线程。大家测试的时候最好是使用普通用户测试。
最后执行检测服务的接口,发现程序还是可以继续访问的。
小结
其实发生OOM的线程一般情况下会死亡,也就是会被终结掉,该线程持有的对象占用的heap都会被gc了,释放内存。因为发生OOM之前要进行gc,就算其他线程能够正常工作,也会因为频繁gc产生较大的影响。