Too many open files error
在linux服务端环境中经常会出现 "too many open files" 的错误,该错误产生的原因是file descriptors(fd)打开过多,超过了linux对单个process的最大限制。那么如何解决呢,主要从两个角度考虑,第一个是进程的确需要更多的fd,这时需要调整fd的最大数量,这里需要调整的数量有两个Hard limit 和Soft limit,另外就是检测程序中是否又fd在open之后没有关闭。
这个需要解释几个概念:
- File Descriptors : 文件描述符,在Unix系列操作系统中的概念,和Windows的File handle(文件句柄)比较像,但是有着本质的不同。Unix操作系统中一切皆为File,比如设备都是文件方式来处理,这与windows有很大的不同。 文件描述不仅包括对文件的处理,还包括Socket,NamePipe,Character device(字符设备,比如键盘等),Block device(阻塞设备,比如光驱,硬盘等) 等
- Hard limit: 硬限制,顾名思义强硬的限制,这里是指超级管理员对fd的最大数量的硬性限制,也就是说非root用户只能使用低于这个数量的fd。
- Soft limit: 软限制,是对非root用的fd数量限制,在这里如果soft limit没有超过 hard limit,非root用户可以进行提升soft limit的数量。
下面就第一种情况说明一下解决办法:
首先, 通过 命令 ulimit -Sn 查看soft limit , 通过命令 ulimit -Hn 查看hard limit. 通过命令 lsof -p 进程号|wc -l 可以查看指定进程打开的fd数量,看看进程所打开的fd是否已经接近或等于 soft limit数量了,如果是那么需要考虑将 soft limit提高,办法有两种,一种是临时提高,一种是永久提高。
- 临时提高,使用命令 ulimit -n 2048(想要修改的数量),这种方式可以临时提高,如果重启机器和关闭Shell,修改都会失效。
- 永久提高,分为四步骤:
- 使用命令:cat /proc/sys/fs/file-max 查看允许fd打开的最大数量,如果最大数量不满足要求,编辑文件 sudo vim /etc/sysctl.conf,插入下面内容:
fs.file-max = 10240(根据自己要求修改), 然后,执行命名:sudo sysctl -p (使修改生效) - 在/etc/security/limits.conf文件中添加下面内容:
* soft nofile 2048
* hard nofile 4096* 表示所有用户,也可以修改为指定用户:
user soft nofile 2048
user hard nofile 4096注意:这里 数量最好设置为 1024的倍数。
- 修改/etc/pam.d/login添加如下一行:
session required /lib/security/pam_limits.so
这里需要注意,如果login文件里已经有 session required pam_limits.so,将原来的删除。
加这句话的目的是使用上一步配置的信息。 -
重启机器。
修改相关参数来提高fd的最大数量是在系统需要的基础上,应该在出现Too many open files错误的时候及时检查程序,是否有未关闭的fd,否则只是治标不治本。