细数一些环境原因发现的bug

1.pgsql最大连接数

案例:项目是采用微服务部署的,很多服务会连pgsql数据库,有些开发在写代码的时候连接了数据库,用完后没有释放,导致连接数不断增加,超过设置的最大限制数量,服务日志就会提示报错。

排查方式:

查询最大连接数
show max_connections;
查询活动的连接数
SELECT COUNT(*) from pg_stat_activity;
查询空闲的连接
SELECT * from pg_stat_activity where state='idle';
临时解决办法一:
删除占用进程,彻底解决还需要开发该代码释放。
SELECT pg_terminate_backend(pid);
临时解决办法二:
修改pgsql的最大连接数
找到数据库安装目录下的postgresql.conf文件,
max_connections = 500,将这个值调大
 
过滤pgsql连接数:netstat -nap|grep 5432|grep 192.168.0.1 |wc -l
 

2.容器化部署问题,如容器中时区不对、验证码不显示

案例:1.时区不对,导致系统中业务数据不准确或者其他业务bug

2.图形验证码不显示,需要依赖内部库

3.系统调用容器外的接口访问不通

 

3.kafka连接数最大问题

此问题和pgsql类似,过滤kafka连接数:netstat -nap|grep 5432|grep 192.168.0.1 |wc -l

 

4.redis问题

1.有些服务只支持单节点部署和哨兵模式部署

2.程序同步机制有问题,redis和最新数据不对应

 

5.接口502、503问题

1.nginx

6.浏览器缓存问题

 

posted @ 2022-03-19 19:26  千君君  阅读(68)  评论(0编辑  收藏  举报