aix 推荐使用重启
重启os
AIX 主机 推荐 shutdown –Fr
在客户一次停机维护中,发现了这个问题。
环境是ORACLE 10G RAC for AIX6,使用了HACMP管理共享磁盘。
在停机维护时间段内需要重启主机,当关闭了数据库和CLUSTER后,节点1使用reboot命令重启操作系统,等了很长时间,系统仍然没有启动的迹象,不得以到机房中检查,发现服务器处于关机状态。
手工启动服务器后,发现HACMP启动报错,原因是/etc/snmpdv3.conf文件被清空。将另外节点的文件拷贝到当前节点上,HACMP和RAC环境顺利启动。
而节点2同样采用reboot操作,同样服务器没有自动重启而只是关机,手工启动后发现ORACLE_HOME所在盘出现错误,必须要执行fsck命令,结果检查出几个不一致的块,并且丢失了一些文件,好在出问题的都是Oracle产生的trace文件,fsck结束后该盘顺利挂载。
特意检查了一下reboot命令,发现这个命令在单用户模式下是重启服务器,而多用户模式下,该命令只是关机,而且可能会导致文件系统的损坏。
正确的重启方式是shutdown –Fr,随后又进行了两次重启,都采用了shutdown –Fr方式,没有碰到任何问题。
issue 2: s手工写了 /orabak/oswbb/oswbb/osw.sh,结果重启主机发现,主机无法登录ssh,telent,通过rlogin 发现crs 也无法重启。
[root@st01:/etc/rc.d/rc2.d]# ls -trl
total 32
-r-xr-xr-x 1 root system 308 Feb 15 2012 Ssshd
-r-xr-xr-x 1 root system 307 Feb 15 2012 Ksshd
-r-x------ 1 root system 2439 Nov 20 2012 Kwpars
lrwxrwxrwx 1 root system 56 Aug 06 2013 S71itcaTivoliCommonAgent0 -> /var/opt/tivoli/ep/runtime/nonstop/bin/nonstopservice.sh
lrwxrwxrwx 1 root system 56 Aug 06 2013 K71itcaTivoliCommonAgent0 -> /var/opt/tivoli/ep/runtime/nonstop/bin/nonstopservice.sh
-rwxr-xr-x 1 root system 175 Aug 22 2013 S00ct_boot
lrwxrwxrwx 1 root system 10 Nov 07 14:05 S96ohasd -> /etc/ohasd
lrwxrwxrwx 1 root system 10 Nov 07 14:05 K19ohasd -> /etc/ohasd
lrwxrwxrwx 1 root system 26 Nov 22 17:03 S99osw -> /orabak/oswbb/oswbb/osw.sh
lrwxrwxrwx 1 root system 26 Nov 22 17:04 K99osw -> /orabak/oswbb/oswbb/osw.sh
drwxr-xr-x 2 root system 256 Nov 22 17:06 tmp
drwxr-xr-x 10 root system 256 Nov 22 17:06 archive
drwxr-xr-x 2 root system 256 Nov 22 17:06 locks
workaroud :
restart ssh can't use , only use rlogin 访问,并且回退这些脚本,重启主机,才可以ssh