生产大文件下载导致 OOM,顺藤摸瓜拿下

上周遇到了生产环境 OOM 的问题,找了一番之后基本定位了是大文件下载导致的问题,于是在网上搜罗了一番文章,下面分享一篇优质的解决方案,整个排查思路非常清晰,小白可以直接对照着来排查。

事故发生

上周五下午运营人员反馈,笔者所负责的后台系统从 14 点以后就卡卡的,虽然页面能够正常加载,但是一直处于数据加载中,数据也提交不了,怀疑笔者的系统有BUG,当听到运营人员的反馈我的第一反应是这不可能啊,这么简单的一个后台系统,还能出事故?

处理流程

  • 摘除其中一台服务器用于保留现场,其他服务器先重启,保证系统可用。
  • 下载GC日志,系统dump文件用于分析

GC log分析

系统启动参数,JVM内存分配:-Xmx4096m -Xms4096m -Xmn2560m

观察日志可知系统每隔 40S 发生一次 Full GC,耗时 200 毫秒,回收以后系统老年代占用也不大,才 15M,但是新生代回收完还有 2 个 G。

有点不可思议,竟然不是老年代塞满了数据,而是新生代塞满了数据。

初步推测是新生代数据要晋升到老年代,结果放不进去而引起的 Full GC。

使用 MAT 对 Dump 文件进行分析

通过总图可以看出来目前系统内存占用超过 2 个 G:

点击 Histogram 进行进一步分析,看出系统中占用最多的是byte[]

点击List Objects进入income引用统计界面

层层点开,发现byte[]被 ResponseEntity 对象所引用,且数量不小

翻阅代码

1)在系统中找到唯一ResponseEntity有关的代码

2)这代码看似没什么问题啊,这不是很正常的文件下载么???我去看看用户下载了啥,跑到目录文件查看一下下。

我的天,用户下载的是一份2.4G的大文件,代码中FileUtils.readFileToByteArray(file) 的方式是把整个文件读取到内存再输出流里写入,此时内存不够分配,又塞不进老年代,只能是 Full GC 了。

3)成功破案了,用户下载了一份大文件,文件先加载到内存才往外写,抹泪。。。。

解决方案

使用FileSystemResource

public ResponseEntity download(@RequestParam("uri") String uri) throws IOException {
  File file = new File(uri);
  if (!file.isFile()) {
   throw new ServiceException("文件不存在");
  }

  String filename = FilenameUtils.getName(uri);
  HttpHeaders headers = new HttpHeaders();
  headers.add("Content-Disposition", "attachment;filename=" + URLEncoder.encode(filename, "UTF-8"));
  HttpStatus status = HttpStatus.OK;
  return new ResponseEntity<>(new FileSystemResource(file), headers, status);
}

使用缓存流,边读边写

@GetMapping("/down")
public void download(@RequestParam("uri") String uri, HttpServletResponse response) throws IOException {
 File file = new File(uri);
  if (!file.isFile()) {
   throw new ServiceException("文件不存在");
  }

  String filename = FilenameUtils.getName(uri);
  response.setHeader("Content-Disposition", "attachment;filename=" + URLEncoder.encode(filename, "UTF-8"));

  try (FileInputStream fileInputStream = new FileInputStream(file);
    BufferedInputStream bufferedInputStream = new BufferedInputStream(fileInputStream);
    BufferedOutputStream bufferedOutputStream = new BufferedOutputStream(response.getOutputStream())) {
    FileCopyUtils.copy(bufferedInputStream, bufferedOutputStream);
  } finally {
   // 使用的是try-with-resources

  }
}

或者 文件存储到 oss 或者是七牛云

posted @ 2024-03-27 11:27  kisshappyboy  阅读(28)  评论(0编辑  收藏  举报