一次正式环境的api访问无响应的问题

  • 问题描述
        2019/06/04,生产环境出现问题,我们所有的小程序的接口调用都出现问题,报的是网络异常。
  • 现象
       使用api通过postman及浏览器调用接口,均无法连接该接口,同时后台日志也无错误打印。无接口调用打印。
    但是有些请求是可以过来的。(现在想来应该是对请求做了限流)。
  • 可能的问题及排查过程
       1.RDS,ECS无压感,CPU使用率,内存使用率均不大。
        2.服务器的网络配置问题,端口是否开放问题,通过ping可以ping通。
        3.容器配置问题,查看容器的数据流。使用tcpdump抓包存在数据流。    
        4.SLB(类似于nigix做的一个负载均衡服务器)问题,SLB转发量为零,无法将数据转发到容器中。
        5.https证书问题,证书过期时间还远。不是证书问题。
        6.域名问题,第一次通过域名ping可以ping通,但是事后有同事说他是ping不通的,域名无法解析。
        
        
  • 最终问题定位
       1.二级域名备案失效,备案抽查被发现,备案号下问题网站被关闭无法访问,最后联系阿里云放开流量控制,补充备案信息。
           
  • 总结
       1.排错过程中,有的同事可以ping通域名,而且期间日志也有打印登陆请求,所以对于该域名的请求应该不是做的截断,
            而是流量控制,在域名服务器做了流量控制。
        2.其实问题是小问题,但是在开发中遇到的问题百分之九十都是小问题,在面对这种问题时脑子里一定要有个清晰的思路,
            对项目中的一个请求流程有一个详细的了解。
posted @ 2019-06-04 16:11  西罗(斗筲小人)  阅读(887)  评论(0编辑  收藏  举报