随笔分类 -  故障排查

摘要:set -x介绍 用于脚本调试,在liunx脚本中可用set -x就可有详细的日志输出.免的总是用echo了 参考 #!/bin/bash set -x a=${1} b=$ 结果 bash This is a premium name 1 2 + a=1 + b=1 set -e介绍 每个脚本都应 阅读全文
posted @ 2021-07-12 10:07 客Ren 阅读(741) 评论(0) 推荐(0) 编辑
摘要:最近在工作中遇到一台生产的服务器CPU使用率过高报警,直线上升,基本上到了100%: CPU使用率 看到报警后第一想到的就是使用top和ps -aux --sort=-pcpu|head -10 命令查看一下进程和CPU top命令执行结果 发现最高的就是pid=2375的JAVA进程,需要进一步找 阅读全文
posted @ 2021-05-18 14:29 客Ren 阅读(2487) 评论(0) 推荐(0) 编辑
摘要:背景 重启用户重启服务后发现web站点打不开了,域名解析对应的地址也ping不通 检查主节点上发现vip不存在了,于是查看keepalived,发现 调整了keepalived配置文件vrid 和相关密码配置,重启keepalived的服务发现vip存在的,但是web站点依然无法访问,vip地址也无 阅读全文
posted @ 2021-03-28 11:55 客Ren 阅读(991) 评论(0) 推荐(0) 编辑
摘要:普通用户登录问题: root用户登录OK,但普通用户登录时提示: -bash:/etc/profile Permission Denied 解决办法: 在root的用户下查看etc目录权限,为744;这个权限是有问题的,其他用户没有列出etc目录下文件的权限,所以其他用户登录会报错! chmod + 阅读全文
posted @ 2021-01-14 16:34 客Ren 阅读(5198) 评论(0) 推荐(1) 编辑
摘要:线上故障主要会包括cpu、磁盘、内存以及网络问题,而大多数故障可能会包含不止一个层面的问题,所以进行排查时候尽量四个方面依次排查一遍。同时例如jstack、jmap等工具也是不囿于一个方面的问题的,基本上出问题就是df、free、top 三连,然后依次jstack、jmap伺候,具体问题具体分析即可 阅读全文
posted @ 2021-01-07 11:36 客Ren 阅读(260) 评论(0) 推荐(0) 编辑
摘要:原因 是因为命令直接从windows 复制过来导致的 解决方法 yum install dos2unix dos2unix **.sh 进行转换 再次执行即可 阅读全文
posted @ 2020-12-17 16:33 客Ren 阅读(608) 评论(0) 推荐(0) 编辑
摘要:排错背景:在一次生产环境的部署过程中,配置文件中配置的访问地址为集群的Service,配置好后发现服务不能正常访问,遂启动了一个busybox进行测试,测试发现在busybox中,能通过coredns正常的解析到IP,然后去ping了一下service,发现不能ping通,ping clusterI 阅读全文
posted @ 2020-12-15 22:23 客Ren 阅读(4394) 评论(2) 推荐(1) 编辑
摘要:第一个抓包实例 打开wireshark,主界面如下: 主界面 2. 选择菜单栏上捕获——>选项,,取消混杂模式,勾选WLAN,开始(你也可以直接双击上图的WLAN开始) 3. 此时wireshark已经开始工作,查看抓包 4. 打开cmd窗口,执行ping https://uestcjhx.gith 阅读全文
posted @ 2020-07-15 17:36 客Ren 阅读(815) 评论(0) 推荐(0) 编辑
摘要:说一下现象是用tpcping 域名 443端口会时断时续的,还很有规律,web页面登录状态也会不断的失效,通过客户端,网关出口,clb,后端 rs抓包查看发现,客户端到clb都正常,clb把tcp syn请求转发给后端rs, rs没有回应 通过查阅资料,发现tcp_timestamps默认是开启,如 阅读全文
posted @ 2020-07-06 15:35 客Ren 阅读(4905) 评论(0) 推荐(0) 编辑
摘要:nginx配置https如下 nginx 后面应用是对应的tomcat应用 server { listen 80; server_name xxxx.com; rewrite ^(.*) https://$server_name$1 permanent; } server { listen 443 阅读全文
posted @ 2020-02-27 20:04 客Ren 阅读(10108) 评论(1) 推荐(3) 编辑
摘要:批量kill掉无用的sql语句,避免影响拖垮数据库。 MariaDB [(none)]> show processlist; + + + + + + + + + + | Id | User | Host | db | Command | Time | State | Info | Progress 阅读全文
posted @ 2020-02-20 14:12 客Ren 阅读(792) 评论(0) 推荐(0) 编辑
摘要:先看一下脚本 直接通过sendmail命令和脚本执行是没有问题,通过zabbix web界面测试就不行 查看了sendmail的日志报错是这样的, 这里google里好多, 修改了dns,改了hosts解析 都不行, 最后我把脚本里的smtp.qq.com改为用dig解析的ip,在测试就没有问题了, 阅读全文
posted @ 2019-11-19 15:13 客Ren 阅读(510) 评论(0) 推荐(0) 编辑
摘要:curl 命令提供了 -w 参数,解释如下 文本文件 curl-format.txt 写入下面的内容: 看一下命令的输出 -w :从文件中读取要打印信息的格式 -o /dev/null :把响应的内容丢弃,不关心,只关心请求的耗时情况 -s :不要打印进度条 DNS 查询:124ms TCP 连接时 阅读全文
posted @ 2019-10-24 14:31 客Ren 阅读(1265) 评论(0) 推荐(0) 编辑
摘要:如果出现了crontab定时任务不执行的情况,首先需要定位问题,那么就需要通过日志来确定问题所在。 crontab的日志位置一般位于/var/log/cron,利用下面的语句即可查看日志。 tail -f /var/log/cron /var/log/cron只会记录是否执行了某些计划的脚本,如果执 阅读全文
posted @ 2019-09-02 11:00 客Ren 阅读(8806) 评论(0) 推荐(0) 编辑
摘要:一、性能故障 1. 数据库主机LOAD飙高(1)一般导致MySQL服务器LOAD突然飙高,可能的五种情况:– 全表扫描的SQL语句;– SELECT操作语句的执行计划走错;– 存在UPDATE/DELETE 语句没有索引可选择,而导致堵塞其他SQL语句的执行;– 存在修改表结构或OPTIMIZE 语 阅读全文
posted @ 2019-09-02 10:15 客Ren 阅读(455) 评论(0) 推荐(0) 编辑
摘要:十一种状态如下图: 全部11种状态1. 客户端独有的:(1)SYN_SENT (2)FIN_WAIT1 (3)FIN_WAIT2 (4)CLOSING (5)TIME_WAIT 。2. 服务器独有的:(1)LISTEN (2)SYN_RCVD (3)CLOSE_WAIT (4)LAST_ACK 。3 阅读全文
posted @ 2019-08-26 14:17 客Ren 阅读(365) 评论(0) 推荐(0) 编辑
摘要:pidstat 概述 pidstat是sysstat工具的一个命令,用于监控全部或指定进程的cpu、内存、线程、设备IO等系统资源的占用情况。pidstat首次运行时显示自系统启动开始的各项统计信息,之后运行pidstat将显示自上次运行该命令以后的统计信息。用户可以通过指定统计的次数和时间来获得所 阅读全文
posted @ 2019-06-20 17:35 客Ren 阅读(1698) 评论(0) 推荐(0) 编辑
摘要:vmstat命令的含义为显示虚拟内存状态(“Virtual Memory Statistics”),但是它可以报告关于进程、内存、I/O等系统整体运行状态。 语法 选项 参数 事件间隔:状态信息刷新的时间间隔; 次数:显示报告的次数。 实例 字段说明: Procs(进程) r: 运行队列中进程数量, 阅读全文
posted @ 2019-06-20 14:03 客Ren 阅读(610) 评论(0) 推荐(0) 编辑
摘要:通过curl命令测试服务器是否支持断点续传 通过curl命令测试服务器是否支持断点续传 curl -i --range 0-9 http://www.baidu.com/img/bdlogo.gif HTTP/1.1 206 Partial Content Date: Thu, 13 Mar 201 阅读全文
posted @ 2019-06-03 12:23 客Ren 阅读(1226) 评论(0) 推荐(0) 编辑
摘要:一、iperf工具安装 源码包下载地址:https://iperf.fr/iperf-download.php#archlinux 选择对应系统的版本就是解压安装了 完成 测试发现有问题 问题原因:Linux系统中找不到libiperf.so.0 库文件,导致执行iperf3 –s时提示缺少相关li 阅读全文
posted @ 2019-04-27 12:14 客Ren 阅读(3872) 评论(0) 推荐(0) 编辑