一次正式环境的api访问无响应的问题
-
问题描述
2019/06/04,生产环境出现问题,我们所有的小程序的接口调用都出现问题,报的是网络异常。
-
现象
使用api通过postman及浏览器调用接口,均无法连接该接口,同时后台日志也无错误打印。无接口调用打印。
但是有些请求是可以过来的。(现在想来应该是对请求做了限流)。
-
可能的问题及排查过程
1.RDS,ECS无压感,CPU使用率,内存使用率均不大。
2.服务器的网络配置问题,端口是否开放问题,通过ping可以ping通。
3.容器配置问题,查看容器的数据流。使用tcpdump抓包存在数据流。
4.SLB(类似于nigix做的一个负载均衡服务器)问题,SLB转发量为零,无法将数据转发到容器中。
5.https证书问题,证书过期时间还远。不是证书问题。
6.域名问题,第一次通过域名ping可以ping通,但是事后有同事说他是ping不通的,域名无法解析。
-
最终问题定位
1.二级域名备案失效,备案抽查被发现,备案号下问题网站被关闭无法访问,最后联系阿里云放开流量控制,补充备案信息。
-
总结
1.排错过程中,有的同事可以ping通域名,而且期间日志也有打印登陆请求,所以对于该域名的请求应该不是做的截断,
而是流量控制,在域名服务器做了流量控制。
2.其实问题是小问题,但是在开发中遇到的问题百分之九十都是小问题,在面对这种问题时脑子里一定要有个清晰的思路,
对项目中的一个请求流程有一个详细的了解。