业务量剧增后服务器常见返回码总结
服务器内部错误,也就是服务器遇到意外情况,而无法执行请求。发生错误,一般的几种情况:
- Web项目中出现异常,项目应用中有Bug
- 访问量大的时候,由于系统资源限制,而不能打开过多的文件句柄
定位思路:
1.查看access.log
[root@prod-nginx-01 ~]# cat /var/log/nginx/access.log | grep --color 'HTTP/1.1" 500' 183.131.0.1 - - [21/Apr/2018:17:40:11 +0800] "POST /checkupdate HTTP/1.1" 500 158 "-" "okhttp/3.6.0" "-" 10.016
- 打开/etc/security/limits.conf
- 修改 limits.conf文件,加上下面两句命令
- 打开/usr/local/nginx/conf/nginx.conf,在worker_processes的下面增加一行配置 worker_rlimit_nofile 65535;
- 重新启动nginx
#查看系统默认的最大文件句柄数,系统默认是1024 [root@prod-nginx-01 ~]# ulimit -n 655350 #查看当前进程打开了多少句柄数,第一列是打开的进程数,第二列是进程ID [root@prod-nginx-01 ~]# lsof -n|awk '{print $2}'|sort|uniq -c|sort -nr|more | head -5 4010 2911 3860 2912 3774 2913 3517 2910 137 13209
Nginx返回码 499(client has closed connection 客户端主动关闭)
官方解释:ngx_string(ngx_http_error_495_page), /* 495, https certificate error*/ ngx_string(ngx_http_error_496_page), /* 496, https no certificate */ ngx_string(ngx_http_error_497_page), /* 497, http to https */ ngx_string(ngx_http_error_404_page), /* 498, canceled */ ngx_null_string, /* 499, client has closed connection */
499,客户端关闭连接,这个状态码并不是http协议中定义的status code,而是nginx自己定义的一个状态码。
- 由于服务器处理请求较多,客户端在有效时间内没有得到答复,主动关闭了连接。
- 有人说把时间设置长一些或者使用proxy_ignore_client_abort on(让代理服务端不要主动关闭客户端的连接)。
- 但是这样也有一定的风险,会拖垮服务器。发生这个错误,如果服务器CPU和内存不算太高,一般是数据库和程序的问题,数据库处理较慢或者程序线程较低。
- 结合情况调整,比如读写分离或者程序线程数调高。
client发送请求后,如果在规定的时间内(假设超时时间为500ms)没有拿到nginx给的响应,则认为这次请求超时,会主动结束,这个时候nginx的access_log就会打印499状态码。
其实这个时候,server端有可能还在处理请求,只不过client断掉了连接,因此处理结果也无法返回给客户端。
499如果比较多的话,可能会引起服务雪崩。比如说,client一直在发起请求,客户端因为某些原因处理慢了,没有在规定时间内返回数据,client认为请求失败,中断这次请求,然后再重新发起请求。
这样不断的重复,服务端的请求越来越多,机器负载变大,请求处理越来越慢,没有办法响应任何请求。
我试图定位了一下我们几个项目中的499出现概率,目前统计的几个接口的出现频率。
interface_1 十万分之五 interface_2 万分之一 interface_3 千分之一 interface_4 千分之一 interface_5 千分之一
相较之下,与运维探讨得出目前的错误率还是可以接收的,可暂不处理。
另外为何0秒返回499 这个不是很好定位确认,网上也没有合理的实践经验,如果要定位需要在较低的概率中抓到出错的请求,具体分析。
结论:可先观察一段时间,如果一直较低概率出现,可暂不处理。
Http返回码 400(Bad Request 错误请求)
1、语义有误,当前请求无法被服务器理解。除非进行修改,否则客户端不应该重复提交这个请求。
2、请求参数有误。
如将原本Post请求的json格式的body换成binary格式就会返回这个错误码及下面的返回结果。
{ "timestamp": 1524322831388, "status": 400, "error": "Bad Request", "exception": "org.springframework.http.converter.HttpMessageNotReadableException", "message": "Required request body is missing: public com.test.http.model.common.Object com.test.http.controller.TestController.forTest(Object,javax.servlet.http.HttpServletRequest)", "path": "/interface" }
Http返回码 405(Method Not Allowed 不被允许的请求方法)
请求行中指定的请求方法不能被用于请求相应的资源。
如原本Post的请求,你换成了Get的请求方式,就会返回这个错误码及下面的返回结果。
{ "timestamp": 1524322516567, "status": 405, "error": "Method Not Allowed", "exception": "org.springframework.web.HttpRequestMethodNotSupportedException", "message": "Request method 'GET' not supported", "path": "/interface" }
参考文章:
https://www.cnblogs.com/kevingrace/p/7205623.html出处:http://www.cnblogs.com/lingyejun/
若本文如对您有帮助,不妨点击一下右下角的【推荐】。
如果您喜欢或希望看到更多我的文章,可扫描二维码关注我的微信公众号《翎野君》。
转载文章请务必保留出处和署名,否则保留追究法律责任的权利。