随笔分类 - Linux 故障排查
摘要:1. 硬件层面分析 物理机宕机时,首先检查 硬件故障,因为这类问题往往最难察觉。 (1)查看硬件日志 如果服务器支持 IPMI(如 DELL iDRAC, HP iLO, Lenovo XClarity),可以通过远程管理接口获取故障日志。 在 Linux 上,可以使用 ipmitool: yum
阅读全文
摘要:ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]' ps -eo stat,pid,ppid | grep '^Z' | wc -l
阅读全文
摘要:临时解决方案: #service postfix status#service sendmail status#service postfix stop[root@wign ~]# ps -ef|grep sendmail|wc -l3038[root@wign ~]# ps -ef|grep po
阅读全文
摘要:事件:记录一次主机重启后导致LVM、vg、pv丢失 原因:例如:/dev/sdb 分区后制作了LVM,又再次进行分区 解决方案: 1、cd /etc/lvm 备份数据: 2、fdisk -l /dev/sdb > back.txt 清空分区: 3、wipefs -a /dev/sdb 4、pvcre
阅读全文
摘要:问题1:./openssl: error while loading shared libraries: libssl.so.1.1: cannot open shared object file: No such file or directory 解决方案:cp /usr/local/opens
阅读全文
摘要:现象: 解决方案: (1)# journalctl 查看原因 (2)可以看出是内存溢出导致进出救援模式,重启解决 # /sbin/reboot -f (3) 如果出现 mount failed 的现象,就需要进行 umount -l /dev/sdX 或者 umount -f /dev/sdX (4
阅读全文
摘要:Failed to register (statd, 1, tcp6/udp): svc_reg() err: RPC: Remote system error - No route to host 解决方案: net.ipv6.conf.all.disable_ipv6=0net.ipv4.con
阅读全文
摘要:解决方案: 一、先进入单系统用户状态 1、开机进入grub菜单界面时,快速按键盘e键,进入编辑界面2、在Linux 16的那1行,将ro改为rw init=/sysroot/bin/sh3、ctrl+x 4、chroot /sysroot 二、修改密码 passwd root #或echo "pas
阅读全文
摘要:现象: openssh升级后造成 登录 出现-bash: ulimit: open files 解决方案: (1) # vim /etc/pam.d/login ==>session required pam_limits.so (2) # vi /etc/ssh/sshd_config ==>Us
阅读全文
摘要:解决方案: (1)设置PasswordAuthentication为yes [root@VM-4-3-centos libin]# vim /etc/ssh/sshd_config 修改后的配置: PasswordAuthentication yes (2)重启sshd服务 [root@VM-4-3
阅读全文
摘要:[Redhat7]Could not open device at /dev/ipmi0 or /dev/ipmi/0 or /dev/ipmidev/0: No such file or directory 报错 解决方案: [root@localhost ~]# modprobe ipmi_wa
阅读全文
摘要:问题:Linux kernel: hpet1: lost 18 rtc interrupts 报错 解决方案:在 GRUB_CMDLINE_LINUX_DEFAULT="quiet hpet=disable" 添加hpet=disable # cat /etc/default/grub GRUB_T
阅读全文
摘要:内网yum源案例: 问题现象: 解决方案: 将enable=1 修改为enabled=0 问题即可解决 [root@localhost cloudman]# vi /etc/yum/pluginconf.d/license-manager.conf [main]enabled=0
阅读全文
摘要:故障现象 原因分析 安装strace命令进行跟踪 # yum install -y strace 抓取报错日志 # strace -o passwd.log passwd 查看日志,发现/usr/lib64/security 目录中没有pam_passwdqc.so # cat passwd.log
阅读全文
摘要:解决方案: # cp /lib64/security/pam_listfile.so /lib/security/ # service vsftpd restart
阅读全文
摘要:记录一次suse系统sshd服务无法启动根据报错解决方案:
阅读全文
摘要:故障现象 sudo: 无法执行 fork: 资源暂时不可用 解决方案1: [2842072.342664] cgroup: fork rejected by pids controller in /user.slice/user-1003.slice/session-153222.scopeclou
阅读全文
摘要:问题描述: 源地址对日志服务器进行日志上传,客户端抓包显示上传成功,但服务端却并未收到客户端的请求 (1)客户端抓包: (2)服务端查看端口是否侦听;rsyslog 为UDP协议 (3)服务端抓取到客户端的ICMP包,说明网络路由没有问题 (4) 解决方案:服务端的外侧 因为有防火墙,所有需要在防火
阅读全文
摘要:宿主机故障虚拟机重启rhel6网卡报已使用故障&rhel7网卡无法启动 宿主机故障虚拟机重启rhel6网卡报已使用 一、故障分析 1、故障现象:RHEL6虚拟机无论怎么重启虚拟机和重启网卡都无法恢复正常 二、解决方案 解决方案1: 1、删除网卡的udev策略,reboot重启操作系统会自动生成网卡策
阅读全文
摘要:一、 故障描述 现象1:oraclelog目录提示坏道信息,进行修复后执行删除文件操作,目录不可使用。 现象2:lsblk看到目录出现重复,并且有tmeta,tdata卷出现(图一) 现象3:message日志出现多目录报错,持续写入(图二) 图一 检查lv #lvs -a 看到多出的pmspare
阅读全文