【运维技术】shell脚本实现线程挂掉,自动重启功能
由于分布式系统的流行,服务器上面部署的项目都是多实例的。而我又希望有一个功能,当服务器出现异常情况能够自动重启实例。
所以我想到了使用shell脚本监控实例进程id,如果不存在的话,就重启对应的实例。
一、轮询监控实现:
1. 使用crontab,缺点一分钟轮询一次
2. 使用shell死循环进行轮询
参考:https://blog.csdn.net/u011261430/article/details/72921991
由于我们系统使用人数比较少,所以我选择crontab进行轮询
二、环境变量问题:
crontab中的环境变量默认不会将我们自行定义的环境变量载入进来,所以执行脚本的时候,需要执行source命令
source /etc/profile
三、日志输出
对于轮询失败的次数和时间需要进行统计,保证能够查询到,所以我们要将日志重定向到一个固定的目录,定时清理
*/1 * * * * /app/crontab/monitor.sh >> /app/crontab/kafka.log
四、代码实例:
crontab -e:将对应日志写入到文件中,方便后期查询失败的情况
*/1 * * * * /app/crontab/monitor.sh >> /app/crontab/kafka.log
文件目录结构:
├── app │ ├── crontab │ ├── kafka.log │ ├── monitor.sh
monitor.sh
记得必须先赋权
chmod 777 monitor.sh
具体代码
#!/bin/sh
# 默认shell执行需要的内容
# 环境变量重新生效 source /etc/profile
# 判断进程是否存在,记得使用grep -v 排除gerp进程 retDesc=`ps -ef | grep "kafka.Kafka /app/kafka/config/server.properties" | grep -v grep` retCode=$? # 判断是否不为0,不为0就重新启动服务器,为0就说明服务器存在
if [ ${retCode} -ne 0 ]; then # invoke aliyun mobile push sms echo $(date +%F%n%T) echo "server down restart..." /app/kafka/bin/kafka-server-start.sh -daemon /app/kafka/config/server.properties >> /dev/null 2>&1 else echo "server on" fi
五、其他
linux中如果需要显示树形目录结构,安装tree库即可
cron日志:tailf /var/log/cron
linux中的标准输入和输出,也就是控制台的输入和输出:https://blog.csdn.net/cjfeii/article/details/10084343
linux中有一个输入时空设备/dev/null 输出到这边的东西是不会占用内存的 > 新文件 >> 附加 2>&1 程序输出和错误输出都走这个输出
赋权命令:chmod 777 *.sh
linux快熟清空文件的三种方法:
echo "" > test.txt(文件大小被截为1字节) > test.txt(文件大小被截为0字节) cat/dev/null > test.txt(文件大小被截为0字节)
路径问题:最好脚本中都使用全路径,避免路径引发的问题。